CIL2008: What’s New With Federated Search

1 Reactie

What’s New With Federated Search 1:30 p.m. – 2:30 p.m. door Frank Cervone, Assistant University Librarian, Information Technology, Northwestern University, en Jeff Wisniewski, Web Services Librarian, University of Pittsburgh (foto volgt)

The federated search landscape market is bursting with vendors offering a multitude of systems with different feature sets. From basic search and retrieval to clustering and visualization, this describes the array of products available and helps you get a handle on the dynamic federated search marketplace and what steps you need to take for your environment.

Wat is federated search? Vervangen van de oude zoekinterface door een nieuw systeem dat alle databases in een keer doorzoekt en het resultaat daarvan samen voegt en ons presenteert. Zij maken een sterk onderscheid tussen zoeken naar artikelen (dat zijn externe databases) en zoeken naar boeken (in je OPAC) . Bij mij is dat onderscheid allang niet meer op die grond aanwezig, je kunt zelfs niet zeggen dat in je OPAC dingen zitten die je zelf bezit, want zoals we gisteren ook hoorden, worden in de meeste OPAC s ook links naar buiten opgenomen. Dan blijft mi alleen over ‘zoeken in een aantal databases tegelijk’.

Voorbeeld ULS digital library Univ Pittsburg als je daarin zoekt, en je beperkt het niet, dan zoekt het in voorgedefinieerde set. Behalve de databases kun je ook op onderwerp zoeken en met die actie voeg je dan meteen bepaalde databases toe aan de zoekactie. Op de website is nergens een A-Z lijst van beschikbare databases opgenomen: omdat de meeste gebruikers toch niet weten welke ze zouden moeten kiezen. Ze gebruiken WebFeat als zoekmachine. (wifi toegang is nu veel te traag voor hen! Ikzelf heb weer een andere genomen, maar als je voor zo’n zaal staat is dat niet gemakkelijk). Als je naar gebruik van hun zoekmachine kijkt zie je dat het gebruik over de jaren heen van metasearches is toegenomen.

Er is niet veel kwaliteitsverschil in de resultaten van zoeken via een metasearch of wat de gebruikers zelf uit de basis databases kregen. Dus waarom moeilijk doen? Wie willen we eigenlijk tevreden houden: de gebruikers of de bibliothecarissen?

Problemen met de federated search machines komen eigenlijk ook omdat de uitgevers zichzelf in de voet geschoten hebben: ‘wij hebben een product maar dat is niet helemaal goed’: ze gaan van een aantal premissen uit die niet waar zijn.

  1. FS leave no stone unturned: dat is niet zo, niet alle databases kunnen met alle federated search engines doorzocht worden , hoewel meeste wel Z39.5 en vrije databases kunnen bekijken
  2. De-dupe really works: echt ontdubbelen is niet mogelijk
  3. Relevance ranking is totally relevant
  4. FS is software
  5. We do not make a search engine, but make search engines better

Mooi plaatje met alle zoekmachines die weer elkaar overnemen: ‘incestuous’.
De Federated Search machines die in 2003 beschikbaar waren zijn nu allemaal weg, op Autonomy na. Reden: markt is niet groot genoeg, niet genoeg te verdienen. Je koopt zowel interface als zoekmachine die erachter zit. Sommigen vendors delen die op en verkopen weer interface om die weer te koppelen

Open source strategies:

  1. Library find. OpenURL resolver 2-click find workflow locally index collections, web-based admin, 3-band caching system, customiz user interface
  2. dbWiz. Fed search trool. Is de oudste veel in Canada, onderdeel van groot systeem reSearcher. Dat kun je ook aan de interface zien.
  3. Masterkey. 100 database stegelijk, relevance ranking, 2000 records per second, faceted search op bron, onderwerp, auteur etc
  4. Open translaters

Je hebt nu ‘Silo bursting’: de nieuwe generatie federated search engines doet meer dan alleen in de Opac en de artikelen zoeken: alle content doorzoeken met een enkel ‘discovery tool’ :

  1. vuFind. Nadruk op catalogus, je kunt op allerlei aparte velden zoeken. Aan zijkant van zoekresultaat ook methoden om zoekactie te beperken: ziet er goed uit
  2. Worldcat local. Te gebruiken als centrale catalogus van aantal bibliotheken Zie bijv Washington libraries
  3. encore. Bij Michigan. Content achter tab is phrase cloud: de correcte term ziet er groter uit
  4. Primo. Ook aan de zijkant interessante methoden om te beperken. Zijzelf vinden die cloud beter, ik weet het zo net nog niet
  5. Aquabrowser. Univ of Chicago. Er is nogal sprake van dat Aquabrowser niet geschikt zou zijn voor een academische omgeving: maar als zij dat doen, waarom dan eigenlijk niet?

Al deze next-gen zoekmachines integreren Federated search content (boeken en artikelen), maar om de artikelen te bereiken moet je eigenlijk nog een extra stap doen. Ze zijn nog niet helemaal klaar, maar zijn wel goed op weg.

Andere systemen die eigenlijk in de biebwereld niet zo bekend zijn:

Take that Google: Microsoft enterprise search: is bezig met connectors to news (live.com news, Yahoo news, Google news, Wired), informations resources (wikipedia etc ), media (Flickr), blogs (Technorati, google blog search)

Trends:

  • Aantal vendors wordt minder, maar er komt meer op het open source domein
  • Progress on the standard front (OpenSearch)
  • Meer visualization (Primo, Aquabrowser)
  • Holistische benadering
  • Betaalbaardere turnkey oplossingen (SaaS delevery)

Zie ook:

Aan eind van de sessie is de Wifi weer weg, en dat niet alleen, ook de telefoon verbinding werkt niet meer 😦 dus ook even niet Twitteren via sms, zelfs rechtstreeks smsen werkt niet meer dus. Vind elkaar dan maar tussen 2000 mensen… wat zijn we afhankelijk van de techniek geworden, en wat functioneert die soms matig.

One thought on “CIL2008: What’s New With Federated Search

  1. Pingback: CIL2008: Next-Generation Library Interfaces « Dee’tjes

Geef een reactie

Vul je gegevens in of klik op een icoon om in te loggen.

WordPress.com logo

Je reageert onder je WordPress.com account. Log uit /  Bijwerken )

Facebook foto

Je reageert onder je Facebook account. Log uit /  Bijwerken )

Verbinden met %s