2 mrt. 2012

Discovery services

Wat is een discovery service?
Een discovery service is een stap in de geschiedenis van het zoeken in bestanden.
Er is een opbouw zichtbaar in het zoeken in bibliotheekbestanden. Eerst had je alleen het zoeken in de bibliotheekcatalogus. Later kreeg je als bibliotheek ook toegang tot andere catalogi, tot de Nationale Catalogus (nu Picarta) en tot andere bestanden (bijv. Pubmed/Medline, Web of Science en journal platforms zoals Science Direct , Springer Link , Wiley Online en veel meer).
Dan rijst al snel de vraag “Kunnen we al die bestanden niet in één keer doorzoeken in plaats van een voor een.?”
Het begin van een Meta Search Engine, een zoekmachine die tegelijkertijd meerdere zoekmachines bevraagt en het antwoord dus tergugeeft uit diverse databases.
Een bekende toepassing van een meta search machine is de Metacrawler, een zoekmachine, die tot mijn verrassing nog steeds bestaat en tegelijkertijd zoekt in Google, Yahoo en Bing.
Toen de ontwikkeling wat verder gingen is de term Meta Search Engine een beetje uit de mode geraakt en is de term ‘Federated search’ geworden. In Wikipedia wordt aangegeven dat er wel een nuanceverschil is (Federated Search gebruikt beter de voor de betreffende database aangemaakte indexen dan Metasearch), maar de NISO (National Information Standards Organization – US) ziet ze als synoniem.

Het grote probleem zit hem ook altijd in de indexen. Als je optimaal gebruik maakt van de mogelijkheden van een bij een bepaald bestand behorende index dan zal je zoekresultaat ook beter zijn. Zo is bijv. Een ‘topic’ search in Web of Science niet te vergelijken met een Mesh-heading search in Pubmed, terwijl ze toch beide zoeken op een onderwerp. Maar waar topic in WoS allerlei, niet gestructureerde woorden uit de titel en het abstract kan bevatten, zijn de Mesh-headings scherp gedefinieerde trefwoorden die in een gestructureerd verband met elkaar nog kunnen worden ingeperkt en/of uitgebreid. Gebruik van de eigen indexen voor een bestand is dan ook aan te bevelen, dat was zeker zo in de tijd van vóór het full-text zoeken. De zoekalgoritmen zijn sterk verbeterd.

Discovery services (of Web-scale discovery) gaan een stapje verder en gaan uit van een eigen gezamenlijke index voor diverse bestanden. Je zoekt in één index en je krijgt geïntegreerd uit een aantal bestanden het antwoord terug. In de Federated Search Blog geeft auteur Sol een aardige uitleg over discovery services (uit 2009) en Jason Vaughan heeft het in American Libraries uit 2010 over Web-scale Discovery.

Er zijn een aantal commerciële aanbieders van discovery services. Dat zijn intermedairs die contacten en licenties hebben afgesloten met uitgevers om de inhoud van hun databases te gebruiken om een ‘unified index’op te bouwen. Zij bieden een centrale service aan en daar kun je dan je eigen databases aan toevoegen. De oplossing is ‘in the cloud’d.w.z. op de servers van de aanbieders.
Aanbieders zijn:
Primo (Exlibris), Ebsco iscovery Service (EDS) , Summon (Serials Solutons) en nog een lijstje (zie de site Unified Resource Discovery Comparison van Lukas Koster en Andy Ekins) soortgelijke aanbieders. Opmerkelijk is dat het meestal gaat om tijdschriftagenten, dan wel leveranciers van link solvers of soortgelijke koppeling van tijdschriftenartikelen metadata aan de full text.

Op 26 januari zijn we in vergadering bijeengeweest, met een aantal KNAW-instituten om de mogelijkheden te bekijken en te bediscussiëren van discovery services. Als gast was daarbij aanwezig Lucas Koster van de UvA. Lukas vertelde ons over het selectieproces en de implementatie van de Primo Discovery Services bij de Universiteitsbibliothehttp://www.blogger.com/img/blank.gifek Amsterdam.

Ter voorbereiding konden we het artikel over Discovery Services uit Library Technology lezen en diverse discovery services raadplegen.
Na de bijeenkomst bleven nog genoeg vragen over. Een van de leukste was die van een van de KNAW-collectie-instituten, die zelf veel databases maken, over de mogelijkheid om al de eigen databases met een unified index toegankelijk te maken.
Nu resten ons de vragen van onze licentie-manager te beantwoorden:
Hier volgen de vragen:
1. Wie heeft wat aan een DT? Waarom?
2. Wat gaat er mis voor wie zonder een DT? Waarom?
3. Voor wie is een DT niet interessant? Waarom?
Stel dat een DT nuttig is:
4. Wanneer een DT?

En die ga ik komend weekend maar eens beantwoorden.

Geen opmerkingen: