23 aug 2012

Ticer 2012 Onderzoeksdata en samenwerking

Marc van de Berg, directeur van de afdeling Bibliotheek en IT diensten van de Universiteit van Tilburg en in die hoedanigheid dus ook directeur van Ticer, geeft een overzicht van de waterval aan rapporten over onderzoeksdata. Een literatuurlijst is te vinden op de Ticer site en op zijn presentatie op Slideshare.

Als lid van het Onderzoeksdataforum van Surf ben ik bij de presentatie van meeste rapporten van Surf geweest en heb de anderen ook opgemerkt en vaak zelfs gelezen. Marc heeft in zijn presentatie een mooi plaatje van al die rapporten, dat alles zegt. Het zegt ook hoe zeer de interesse voor onderzoeksdata leeft en hoe overal mensen proberen om orde in die chaos (= hoeveelheid, = verscheidenheid, = meningen) te brengen. Bij de meeste wordt wel gesproken over een rol voor de bibliotheek, behalve bij de laatste: het rapport van de Royal Society “Science as an open Enterprise”
Dat geeft een aantal aanbevelingen zoals (die ook heel veel in de andere rapporten worden genoemd): • Data moet niet beschouwd worden als een private aangelegenheid • Een onderzoeker moet credits krijgen voor data • Er moeten standaarden worden gedefinieerd; • Het bewaren van data moet geen verordonering van bovenaf zijn • Er moeten data scientist worden opgeleid • Er moeten software tools voorhanden komen Marc is lid van de LIBER werkgroep Research data management. Deze werkgroep heeft om de stand van zaken en de problemen te inventariseren een aantal workshops gehouden, op de laatste hebben zij de te nemen stappen geprioriteerd. In een tamelijk flauwe acties moesten (op papier!!!) als exercitie de stappen prioriteren. Enfin er kwam verder niets uit, en het staat ook niet op de website. Dus we wachten wel af. (de aanbevelingen staan wel in de ppt van Marc).
Voor een link- en literatuuroverzicht naar research data managementrapporten aanbevolen.

Tijdens de thee hoorde ik van een Engelse dat de beroemde DCC Lifecycle Model niet zo stimuleren is als menigeen denkt, het schrikt onderzoekers zelfs af.

Als laatste spreker kwam Rachel Frick aan het woord met haar presentatie over Boundless opportunities: the impact van cloud-based services. De mogelijkheden die ze wil bespreken zijn die van de ‘distributed services’ (gedecentraliseerd samenwerken, de collecties (ook onderzoeksdata behoort daar om bij) en expertise (bezinning op rol van bibliothecaris). Ze spreekt over ‘ macrosolutions’ , oplossingen die je door samenwerking en netwerken en door schaalvergroting makkelijker kunt oplossen. Zo kan er een collaboration continuum ontstaan.
Ze noemt als voorbeeld de Hathi Trust, een samenwerking van bibliotheken die collecties gingen digitaliseren via Google, waarvan 30 % vrij van copyright is. Maar ook over bijv. de Hertitage Library (biodiversiteitsboeken) Haar organisatie (CLIR, Council for Library and Information Resources) heeft een boek uitgegeven over Research Data en de problemen daaromheen The Problem of Data. Op veel universiteiten in USA ontstaan data curation centers+ research centers die onderzoekers ondersteunen. De bibliotheken moeten daar met het oog op data/collectievorming ook deel in nemen als potential distributed data stores. Want de manier van wetenschappelijk publiceren gaat veranderen zegt ze :” datapapers will eclips the journal article” . Uiteindelijk zullen datapublicaties het gaan winnen.
En waar leidt dit alles toe: tot de “de-centered networked library”. Voorheen noemden we dat een ‘virtuele bibliotheek’, maar het klinkt mooi en het bijbehorende plaatje is geweldig. Nu zijn ook de technische mogelijkheden zover dat het zou kunnen slagen, dat was zo’n 10-15 jaar geleden niet zo. De mogelijkheden zijn inderdaad (bijna) onbegrensd: in de cloud is sociale innovatie volgens het constellation model mogelijk. Of om met Simon Mainwairing te spreken:’In future brands are no longer places you visit, but people you meet down the road”. Meer over het constellation model of collaborative social change in artikel van Tonya Surman.

22 aug 2012

Ticer 2012 Strategie

Maandag 20 augustus 2012 start de 15e Ticer Summer School. Ticer staat voor Tilburg Innovation center for Electronic Resources. Voor mij is het de tweede keer dat ik een Ticer meemaakt: van 26 – 31 augustus 2007 heb ik ook een summerschool meegemaakt, lees het verslag.
Deze keer zit ik in Hotel de Postelse Hoeve, in plaats van tegenover het Warande-bos tegenover het Tweestedenziekenhuis. Het is erg warm, er is geen airconditioning alleen een grote plafondventilator: Apocalypse Now:)
De Summerschool wordt geopend door Thomas Place, die slecht verstaanbaar spreekt, ik let ook niet erg op want het eerste uur ben ik bezig om de wifi aan de praat te krijgen. Het systeem is zodanig beveiligd dat het niet duidelijk is hoe je kunt inloggen: we hebben weliswaar een administratienummer en dus gebruikersnaam en wachtwoord gekregen, maar dat vergt evenzogoed nog een heel strak geregistreerde serie van toetsaanslagen voor het lukt. Daardoor heb ik waarschijnlijk ook het bericht gemist dat het diner in plaats van om 18:00 uur pas om 19:30 uur zou plaats vinden en kom ik dus anderhalf uur te vroeg in het restaurant. De zaal is vol, ik schat zo’n zestig a zeventig mensen.
De eerste dag staat ‘strategie en management’ centraal en gaat het eerst over de toekomst van de bibliotheek. Tot zover nog niet zo veel verschil met 2007. Maar de eerste presentator, David Lankes, is een inspirerend spreker, hij spreekt over over ‘ Libraries as a platform: unlocking the potential of our communities’ zie ok zijn blog

Is de missie/visie van een bibliotheek hetzelfde als die van een bibliothecaris? NEEN, zegt hij, daar zit hem al het verschil. Als bibliothecaris heb je een missie – je wilt kennis overdragen, die toegankelijk maken op een open en natuurlijke manier en daarvoor alle mogelijke middelen inzetten. Voor een instituten gelden andere waarden. Lankes voorziet in een 'new librarianship' (heeft daarover ook een Atlas gepubliceerd met een toekomst voor de catalogus. De catalogus kan in een gekoppeld systeem allerlei zaken bevatten zoals evenementen, profielen, content, bibliografische data, en links. Dan kun je een holistisch systeem aanbieden. Lankes noemt dat : "Facilitated knowledge creation in community around the library". En ja, zegt hij het zijn juist de bibliothecarissen die dat moeten doen want zij hebben de juiste mix van missie( kennis delen), waarden (open) en dienstverlening(infra) en dat is wat definieert een bibliothecaris. Zijn enthousiasme werkt aanstekelijk, zeker wanneer hij nodig afsluit met een poster met ‘Be radical’. [In wezen is librarianship een radicaal beroep, omdat je altijd aan het veranderen bent].

Lankes nieuwe ideeën en frisse brille steken wat af tegen het volgende verhaal. Norbert Lossau geeft overzicht van 10 jaar Open Access van de Berlin Declaration tot PEER Project en Duitse OA-site . Dan zie je wat 10 jaar strijd doet met een onderwerp: als discussiepunt en in het bewustzijn van bijna alle stakeholders leeft het begrip Open Access wel, maar tegelijkertijd is het van een radicale beweging omgevormd en geïncorporeerd door de bureaucratie. Lossau laat dan ook een waterval horen van afkortingen: EU-projecten, PEER en COAR en OpenAire. Van overheden, universiteiten, uitgevers en financiers, alle hebben een zegje over Open Access. Recentelijk weer is in het eindrapport van PEER komen vast te staan dat green OA (zelf-archivering van manuscript) geen negatieve betekenis heeft voor verkoop en ook recentelijk is weer berekend dat als iedereen mee zou doen en we voor gemiddeld 1000-1500 Euro zouden betalen per publicatie, we nog goedkoper uit zouden zijn dan met het huidige licentie-systeem.
Naast me zit Herbert van de Sompel en moppert: OA is mislukt, we wilden dit helemaal niet zo, in commissies en met reeds gepubliceerde artikelen, we wilden ruwe data publiceren en dat dan in concurrentie aanbieden aan uitgevers. Lossau zelf, heeft ook een eigen wikipediapagina .
Open Access is geen doel op zich en moet gezien worden in het groter geheel van de eScience ResearchInfrastructures. Hij heeft in Liber Quarterley een overzichtsartikel geschreven over onderzoeksinfrastructuren. Daarin beschrijft hij ook de zogenoemde 'scientific data factories' die moeten zorgen voor federatief (geïntegreerd zoeken voor alle materialen) OA voor online resources. Al vanaf de Berlin Declaratie was onderzoeksdata en aanvullende materialen onderdeel van OA, niet alleen publicaties. Lossau’s boodschap is dat we in gesprek moeten blijven met uitgevers, financiers en auteurs.

24 apr 2012

Over het gezag van de wetenchap

Dijstelbloem, H., & Hagendijk, R. (2011). Onzekerheid troef: Het betwiste gezag van de wetenschap. Amsterdam: Van Gennep. In deze bundel worden aan de hand van verschillende cases gekeken naar het gezag van de wetenschap. Aan bod komen onder meer de maatschappelijke discussie over Genetische Manipulatie, Baarmoederhalsvaccinatie, de ‘onverwachte’ bankencrisis’, de schuivende voedselvoorlichting,de falende forensische uitspraken, de kafkaiaanse systeemfouten in overheidsbestuur en de citizen science in leefexperimenten. Dat maakt de bundel heel divers, maar uiteindelijk komen Dijstelbloem en Hagendijk toch wel tot een eenduidige conclusie: het gaat niet zozeer om wetenschap an sich, maar om de maatschappelijke toepassingen ervan en arrogantie en ivoren toren-gedrag van wetenschappers werkt contraproductief.
Een aantal interessante punten worden aangereikt:
rol van het publiek: De ‘deficit hypothesis’, de idee dat het publiek domweg te weinig kennis en begrip heeft van wetenschap om zinvol deel te nemen aan publieke discussies en democratische besluitvorming leeft nog steeds onder de gevestigde wetenschappers. Inmiddels is toch wel duidelijk dat er beter naar het publiek moet worden geluisterd en met het publiek moet worden gecommuniceerd. Maar door ‘zelfoverschatting en chronisch gebrek aan institutionele zelfreflectie’ neemt de vervreemding tussen publiek en wetenschap alleen maar toe.
rol van de media : De scheiding tussen nieuwsvorming en beleidsvorming raakt vervaagd en dat leidt tot een ‘gemediatiseerde tijd”(-politiek – bestuur). De politiek van veelvoudigheden stelt dat gezaghebbend bestuur georganiseerd moet worden in een wereld van hyperrealiteiten, waarin politici meer dan eens zullen moeten reageren op incidenten en beelden en op betekenissen die anderen (..) toeschrijven.
houding van de ‘wetenschap’: In het debat over de HPV-vaccinatie voor meisjes speelt de Gezondheidsraad een rol in het communicatieproces die onzekerheid oproept. Ze presenteren zich als stem van de wetenschap, maar ze overstijgen de wetenschap in een poging tot oplossing voor een maatschappelijk vraagstuk te komen. Roger Pielke heeft de verschillende rollen van de wetenschapper beschreven in een vierveldentabel, waarbij de ‘pure scientist’ maar zelden voorkomt. De werkwijze van de Gezondheidsraad, de combinatie van wetenschappelijke gegevens en morele en politieke overtuigingen leiden tot een houding die Pielke noemt ‘stealth issue advocacy’. Door deze houding had het publiek het gvoel niet goed voorgelicht te zijn en ontstond er grote twijfel en onrust. Beter ware het geweest om de houding aan te nemen van ‘honest broker of policy alternatives’.m Dit had kunnen leiden tot meer openheid en overleg in samenstelling van het advies, waardoor er ook niet een gelijkluidend advies uit was gekomen, maar een aantal scenario’s.
rol van systemen: Twee hoofdstukken worden besteedt aan de waarde van de economische wetenschap, waarbij het voorspellen een belangrijke functie heeft. Aan de hand van geschetste modellen kunnen voorspellingen worden gedaan. Zaak is wel om dan alle factoren die van invloed zijn erbij te betrekken. Met als conclusie dat het vertrouwen in de economische wetenschap afhangt van de geldigheid van de gebruikte modellen. Noodzakelijk is een open leerproces en streven naar continue verbetering van systemen.
rol van voorlichting: In het hoofdstuk over voedselvoorlichting komt aan de orde dat het vertalen van uitkomsten van wetenschappelijk onderzoek naar verantwoord individueel dan wel collectief handelen nog niet zo eenvoudig is. De wetenschap die nodig is in de publieke ruimte betreft niet zozeer verschuivende zekerheden, maar zoekt nar goede manieren om onzekerheden te hanteren. En ‘In plaats van het lab te laten regeren over complexe praktijken, start zulke wetenschap vanuit die praktijken”.

Conclusie: ‘omgaan met onzekerheid in wetenschap, politiek en samenleving’.
De beschreven controverses zijn niet zozeer wetenschappelijke als wel maatschappelijke controverses. ‘wetenschap staat bij de burgers in hoog aanzien, de verwachtingen zijn hoog gespannen en de ermee geassocieerde potentiële persoonlijke, commerciële en collectieve belangen groot. Maar daarom wordt ook de schijn van partijdigheid en vooringenomenheid gemakkelijk gewekt en geëxploiteerd door burgers die afwijzend of argwanend staan ten opzichte van plannen, voorstellen en projecten. Er zijn allerlei aanwijzingen dat burgers wetenschap erg belangrijk vinden en veel vertrouwen hebben in wetenschappelijke instellingen. Maar tegelijkertijd zijn veel burgers uiterst wantrouwig als wetenschappelijke expertise lijkt te worden vermengd met commercie of politiek. “
En nog een laatste aardige zin:, “Dat het primair maatschappelijke kwesties zijn waarin wetenschap en technologie een belangrijke maar niet allesbepalende rol spelen, is een inzicht dat vooral wetenschappers nog wel eens over het hoofd lijken te zien. “

Ik lees zojuist dat de Jonge Akademie een advies m.b.t. wetenschapscommunciatie heeft uitgebracht. Tussen onderzoek en samenleving: Aanbevelingen voor optimale wetenschapscommunicatie. De Jonge Akademie. 2012 | 28 pagina's | ISBN 978-90-6984-643-9 | Gratis te downloaden.

5 apr 2012

Library Camp: Unconference



Mijn eerste 'unconference': "Er is vantevoren geen inhoudelijk programma, alleen een raamwerk-agenda. Er zijn dus ook geen Powerpoints of andere slideshows.
Het is gebaseerd op de principes van OpenSpace."

De 'Open space' uitvoering was wat lastig (tussentijds veranderen van sessie was niet echt aan de orde), maar verder was het een echte unconference, een informeel samenzijn, waarbij er niet een persoon was die iets heeft voorbereid, presenteert en de discussie voorzit.
Het mooiste deel was meteen aan het begin bij het - uitgebreide - voorstel rondje.
Prachtig wat een mooie verzameling professionals.
We konden allemaal onszelf introduceren en aangeven wat we zouden willen bespreken tijdens die dag. Er waren zo'n 100 deelnemers en ik heb hieronder een kleine 58 onderwerpen genoteerd.


Daar werd een agenda van gemaakt verdeeld in 5 sessies. Iedereen kon zelf een sessie kiezen. Tijdens de sessies werd gediscussieerd over het onderwerp.
Uiteraard veel over de rol en de toekomst van de bibliotheek en de bibliothecaris.
Over klantvriendelijkheid en klantgerichtheid, over in contact komen met klanten, sociale media en rolmodellen. "De klant wil geen boormachine kopen: hij wil gaten boren".
Over de houding van de bibliothecaris als facilitator, als antenne, over het omgevingsbewustzijn: zowel bibliothecaris als klant moeten weten wat mogelijk is, oude structuren moeten worden doorbroken. Het ging over 'De klant is koningin' en over de 'Bibliotheek van 100 talenten'. Over 'gamen als katalysator', 'the floor is yours', het retail concept, de bibliotheek als studieruimte, als stekkerruimte, als stiltecentrum, als huiskamer.
- Wel leuk als die OB inbreng: ik heb nog nooit in een OB gewerkt, misschien toch nog eens proberen:) -
Maar ook wat te doen als je fysieke bibliotheek wordt opgeheven. Je verliest je focuspunt, de neutrale ruimte om contact te leggen met je klant. Moet je verder gaan als 'bibliografie'? De fysieke bibliotheekruimte bedoeld voor kennis delen, tools introduceren, waar je deskundig personeel vindt die je begeleidt naar informatie.

Helaas niet gesproken over inzet en taak in multimediale videoprojecten nog over businessmodellen voor open access. Maar het was een alleszins inspirerende bijeenkomst, waarbij ik veel mensen heb gesproken en veel heb gehoord waarover ik nog eens kan nadenken.
En dat alles terwijl het kampvuur brandt: op naar het volgende 'bibliotheek kamp'.
'Bibliotheek als begrip een heel sterk merk, dat moet je niet verkwanselen door allerlei modieuze naamgeving. In marketing-termen is het concept 'bibliotheek' ijzersterk.






22 mrt 2012

Symposium Databeheer

Op donderdagmiddag woonde ik het symposium bij ‘Databeheer in de praktijk’. Laurens Sesink, de symposiumvoorzitter (DANS) introduceerde de middag door te constateren dat het onderwerp ‘beheer onderzoeksdata’ erg leeft en dat er veel bijeenkomsten over zijn. Dat kan ik bevestigen: ik heb zelf heel wat praatsessies meegemaakt over dit onderwerp (vanuit het Onderzoeksdataforum en in een poging om databeheer cursussen in de praktijk toe te passen) en ik zie ook heel veel nieuwe gezichten, maar ook een aantal bekenden, 35 in totaal.

CARDS: Controlled Access to Research Data Stored securely gaat vnl. over het beheer van onderzoeksdata ten tijde van het lopende onderzoek . Dus nog niet over duurzame opslag, dat is toch weer een ander (vervolg) verhaal.
Vanmiddag gaat het speciaal over het project CARDS. Er is een eindrapport verschenen en projectleider Ana van Meegen geeft daarover uitleg. Meerdere universiteiten hebben aan Cards meegedaan en hoewel de details verschilden per discipline is het algemene beeld toch wel overal hetzelfde (helaas nog steeds wat ikzelf al in 2007 constateerde): er is veel onwetendheid, veel onbegrip over wat mogelijk en voorhanden is en wat niet, ook m.b.t. de rol van de verschillende spelers: onderzoeker, ondersteuner, ict-er.
Uitgangspunten waren: de onderzoeker staat centraal, optimale ondersteuning, hands-on learning. Bedoeling is te komen tot een professionalisering van de ondersteuning (in eerder project was al eens geconstateerd dat onderzoekers ondersteuning wilden) en een inventarisatie van de wensen van de onderzoekers.

De ondersteuning kenmerkt zich door heel veel verschillen, in aard en niveau, vanuit bibliotheek, vanuit ICT, vanuit Research Support en met ook weer een keur aan benamingen waaruit de rapporteurs uiteindelijk met ‘dataspecialist’ naar voren kwam, maar tijdens de bijeenkomst bleek ook de ‘datasupporter’ als benaming wel over aanhangers te beschikken.
Onderzoekers blijken niet geïnteresseerd in verrijkte en/of open data. Onderzoekers willen bij voorkeur controle over hun data en zicht houden op wat ermee gebeurd. Ze willen minimaal tijd investeren en een vlotte technische infrastructuur en ondersteuning en advies bij metadatering, digitalisering en naast allerlei tips ook graag ondersteuning bij uitvoering.

De aanbevelingen van het CARDS project zijn:
- Zorg voor helder beleid
- Zorg voor goede ondersteuning
- Zorg voor bruikbare infrastructuur

Een van de concrete projectuitkomsten is de informatietoolbox voor het opzetten van een datamanagementplan. Deze toolbox kan vanaf de site van DANS worden gedownload.

De verschillende deelprojecten werden uitgevoerd op de verschillende universiteiten. Tijdens deze middag kregen we iets te horen over de projecten bij de UvA (Driek Heesakkers), UL (Peter Verhaar), UvT (Rob Grim) , UT (Maarten van Bentum) en VU (Peter Sol).
Zo bleek tijden de projecten in Amsterdam (UvA) dat er weinig bekend was, de pilot toonde de gaten in infrastructuur, en de onbekendheid met standaarden. Er waren veel vakgroepspecifieke vragen, en ook vraag ook om digitalisering en auteursrechtenkwesties.
In Leiden werd het project uitgevoerd door een VRE: virtual research environment op te zetten, met behulp van Sharepoint software, waarin de onderzoeker meteen kan uploaden geluidsopnamen en beschrijvingen toevoegen en gedetailleerde toegangsrechten regelen. Bij ondersteuning is meer vakkennis nodig en bij onderzoeker meer kennis van conventies, toch een positieve evaluatie met een helder idee voor vervolg i.s.m. 3TU.
Bij het Taxi-project in Tilburg ging het uiteindelijk over gebruik van internationale standaarden en software op gebied economische statistieken. Er blijkt weinig bekendheid over toch algemeen geldende standaarden zoals SDMX en open source software Fusion Registry.
In Twente werd een datacatalogue tool ontwikkeld in eXist voor intern beheer met goede zoekmachine, maar een Spartaanse gebruikersinterface. De ondersteuning zorgt voor basiskennis op gebied data management en de infrastructuur is primair. Een goede relatie met IT is essentieel.
De IT van VU heeft CARDS ingebed in DMS, het Document management Systeem waarbij giga- opslag bij onderzoeker blijft buiten de zoekmachine. Zij vinden dat capaciteit vanuit de centrale organisatie geregeld moet worden.

Na de presentaties van de projecten volgt een korte breakoutsessie, waarbij we in groepjes kunnen discussiëren over de aanbevelingen van het CARDS-project en dan m.n. wie is aan zet om welke noodzakelijke actie te nemen m.b.t. ondersteuning onderzoeksdata-beheer.
Uitgangspunt moet zijn speciale standaarden en metadata, die liefst centraal en internationaal gehanteerd worden, en verantwoordelijk financiers om eisen te stellen.
Ontbrekende en/of haperende infrastructuur, niet alleen technische, maar ook qua beheersorganisatie, moet op nationaal niveau worden aangepakt en er moet een uitspraak komen van Surf en eScience. Meer focus op delen en niet op archiveren, vakinformatie is noodzakelijk dus disciplinegerichte aanpak .

De rol van SURF in dit geheel was de uitvoering van het Surfshare programma. Als een vervolg wil Surf een Dutch Research Data Commons creëren, althans het draagvlak daarvoor onderzoeken met workshops en overleg. Het onderzoeksdataforum krijgt een vervolg als een Special Interest Group waarschijnlijk onder de naam Research Output.

2 mrt 2012

Discovery services

Wat is een discovery service?
Een discovery service is een stap in de geschiedenis van het zoeken in bestanden.
Er is een opbouw zichtbaar in het zoeken in bibliotheekbestanden. Eerst had je alleen het zoeken in de bibliotheekcatalogus. Later kreeg je als bibliotheek ook toegang tot andere catalogi, tot de Nationale Catalogus (nu Picarta) en tot andere bestanden (bijv. Pubmed/Medline, Web of Science en journal platforms zoals Science Direct , Springer Link , Wiley Online en veel meer).
Dan rijst al snel de vraag “Kunnen we al die bestanden niet in één keer doorzoeken in plaats van een voor een.?”
Het begin van een Meta Search Engine, een zoekmachine die tegelijkertijd meerdere zoekmachines bevraagt en het antwoord dus tergugeeft uit diverse databases.
Een bekende toepassing van een meta search machine is de Metacrawler, een zoekmachine, die tot mijn verrassing nog steeds bestaat en tegelijkertijd zoekt in Google, Yahoo en Bing.
Toen de ontwikkeling wat verder gingen is de term Meta Search Engine een beetje uit de mode geraakt en is de term ‘Federated search’ geworden. In Wikipedia wordt aangegeven dat er wel een nuanceverschil is (Federated Search gebruikt beter de voor de betreffende database aangemaakte indexen dan Metasearch), maar de NISO (National Information Standards Organization – US) ziet ze als synoniem.

Het grote probleem zit hem ook altijd in de indexen. Als je optimaal gebruik maakt van de mogelijkheden van een bij een bepaald bestand behorende index dan zal je zoekresultaat ook beter zijn. Zo is bijv. Een ‘topic’ search in Web of Science niet te vergelijken met een Mesh-heading search in Pubmed, terwijl ze toch beide zoeken op een onderwerp. Maar waar topic in WoS allerlei, niet gestructureerde woorden uit de titel en het abstract kan bevatten, zijn de Mesh-headings scherp gedefinieerde trefwoorden die in een gestructureerd verband met elkaar nog kunnen worden ingeperkt en/of uitgebreid. Gebruik van de eigen indexen voor een bestand is dan ook aan te bevelen, dat was zeker zo in de tijd van vóór het full-text zoeken. De zoekalgoritmen zijn sterk verbeterd.

Discovery services (of Web-scale discovery) gaan een stapje verder en gaan uit van een eigen gezamenlijke index voor diverse bestanden. Je zoekt in één index en je krijgt geïntegreerd uit een aantal bestanden het antwoord terug. In de Federated Search Blog geeft auteur Sol een aardige uitleg over discovery services (uit 2009) en Jason Vaughan heeft het in American Libraries uit 2010 over Web-scale Discovery.

Er zijn een aantal commerciële aanbieders van discovery services. Dat zijn intermedairs die contacten en licenties hebben afgesloten met uitgevers om de inhoud van hun databases te gebruiken om een ‘unified index’op te bouwen. Zij bieden een centrale service aan en daar kun je dan je eigen databases aan toevoegen. De oplossing is ‘in the cloud’d.w.z. op de servers van de aanbieders.
Aanbieders zijn:
Primo (Exlibris), Ebsco iscovery Service (EDS) , Summon (Serials Solutons) en nog een lijstje (zie de site Unified Resource Discovery Comparison van Lukas Koster en Andy Ekins) soortgelijke aanbieders. Opmerkelijk is dat het meestal gaat om tijdschriftagenten, dan wel leveranciers van link solvers of soortgelijke koppeling van tijdschriftenartikelen metadata aan de full text.

Op 26 januari zijn we in vergadering bijeengeweest, met een aantal KNAW-instituten om de mogelijkheden te bekijken en te bediscussiëren van discovery services. Als gast was daarbij aanwezig Lucas Koster van de UvA. Lukas vertelde ons over het selectieproces en de implementatie van de Primo Discovery Services bij de Universiteitsbibliothehttp://www.blogger.com/img/blank.gifek Amsterdam.

Ter voorbereiding konden we het artikel over Discovery Services uit Library Technology lezen en diverse discovery services raadplegen.
Na de bijeenkomst bleven nog genoeg vragen over. Een van de leukste was die van een van de KNAW-collectie-instituten, die zelf veel databases maken, over de mogelijkheid om al de eigen databases met een unified index toegankelijk te maken.
Nu resten ons de vragen van onze licentie-manager te beantwoorden:
Hier volgen de vragen:
1. Wie heeft wat aan een DT? Waarom?
2. Wat gaat er mis voor wie zonder een DT? Waarom?
3. Voor wie is een DT niet interessant? Waarom?
Stel dat een DT nuttig is:
4. Wanneer een DT?

En die ga ik komend weekend maar eens beantwoorden.

15 feb 2012

Surf Onderzoeksdag


De ondertitel van deze dag luidt: “Inspiratie voor ICT-gebruik in onderzoek” en in de beschrijving van de dag staat: “ Op de SURF Onderzoeksdag laten onderzoekers zien hoe ICT-methoden en -hulpmiddelen wetenschappelijk onderzoek, en de presentatie daarvan, kunnen verrijken en vernieuwen.”
In een uitverkocht MediaPlaza (van de Jaarbeurs) druppelden de 200 deelnemers wat verlaat binnen i.v.m. de aangepaste NS-dienstregeling vanwege het winterweer. Jammer dat er na een uurtje staan in de trein nauwelijks zitgelegenheid is in Media Plaza om koffie te drinken, maar gelukkig was er wel – gratis – wifi en ik heb zelfs een stopcontact gevonden.
Over het onderwerp was ik een beetje op het verkeerde been gezet, omdat ik de uitnodiging voor deze dag vanuit de SurfShare maillijst had gekregen. En ik was betrokken bij het onderzoeksdataforum als onderdeel van SurfShare, dus tot vlak voor de dag was ik in de veronderstelling dat het om onderzoeksdata ging. Maar SurfShare was natuurlijk veel breder. Hoewel ik het niet meer expliciet zie sta, dacht ik wel dat deze dag een afsluiting van SurfShare betekende. Het gaat daarbij op ‘open onderzoek’ met trefwoorden als open access, collaboratories, verrijkte publicaties , samenwerking en dus ook toegang tot onderzoeksdata.
De opening stond in het teken van open access met een flitsende keynote van Cameron Neylon, die blogt onder de titel “Science in the Open”. Neylon is werkzaam bij de Science & Technology Council (onderdeel van de Research Council UK). Een groot deel van de tekst van zijn lezing is te vinden in zijn blogpost getiteld ” Network Enabled Research: Maximise scale and connectivity, minimise friction”.
Het komt erop neer dat met Internet en de oneindige connectiviteit een efficiënte transfer van informatie mogelijk is. Zo’n netwerk maakt het mogelijk om ook onderzoek op een kwalitatief hoger plan te brengen, zie de voorbeelden van crowd sourcing op wiskundig en astronomisch terrein.
Ook in Nederland is dat aan de gang. Ik las gisteren over het project Vele Handen.nl, waarbij het Stadsarchief Amsterdam i.s.m. met enkele bedrijven het publiek vraagt mee te helpen met het indexeren van archiefstukken, en de resultaten zijn overweldigend. De website Velehanden.nl heeft op 14 februari de Geschiedenis OnlinePrijs gewonnen.
Terug naar Neylon, die dus in de connectiviteit van het netwerk een mogelijkheid ziet op op grotere schaal onderzoek te doen. Neylon zegt dat we nu te maken hebben met netwerken die zorgen voor een enorme toename van kwalitatieve onderzoekscapaciteit . Onderzoek waarin ook de ‘gewone’ burger geïnteresseerd is, d.w.z. in het effect van het onderzoek, niet in de wetenschappelijke papers. Maar die papers zijn wel het noodzakelijke communicatiemiddel tussen de ‘ruwe data’ van onderzoek en het feit dat de uitgevers een businessmodel hanteren van betaalde toegang tot die papers veroorzaakt weerstand in het systeem van netwerk-connectiviteit.

“Currently we take raw science and through a collaborative process between researchers and publishers we generate a communication product, generally a research paper, that is what most of the community holds as the standard means by which they wish to receive information. Because the publishers receive no direct recompense for their contribution they need to recover those costs by other means. They do this by artificially introducing friction and then charging to remove it.”


Want wat zijn de voorwaarden voor voor soepele en efficiëntie onderzoeksnetwerken:
1. Schaal en connectiviteit [internet en webservices]
2. Lage weerstand bij informatie-overdracht [geen betaalde toegang]
3. Filters aan vraagzijde [de gebruiker bepaalt, niet leverancier; de gebruiker aggregeert, index en reviewed]
Nog wat interessante uitspraken van Neylon:
“At the scale of a network you can manufacture serendipity”
“The content industry is dead”

Na de inspirerende voordracht van Cameron Neylon onderstreepte Jos Engelen van NWO nog eens het belang van open acces. Het is, zei hij een logische gedachte dat door openbaar geld gefinancierd onderzoek ook openbaar toegankelijk is, al dan niet meteen. En uiteindelijk gaan we het winnen van uitgevers.
Volgens Engelen is "escience" belangrijk maar niet alles. Hij ondersteunt het Nederlandse eScience Center (door NWO en Surf samen opgezet) , maar daarnaast zijn ook andere investering in de ict-infrastructuur nodig. Hij verwijst naar de Roadmap ICT voor de topsectoren.

Na de lunch werden de vijf parallele sessies gestart. Er was een sessie over tekst en taal met presentaties over e-Humanities en nanopublicaties; een sessie over data met presentaties over ‘Big data”Mess Project en CARDS. In de sessie Beeld en Geluid ging het over misicologie en virtual en augmented reality. In de sessie over Onderzoek en onderwijs over opleiding tot datascientist , virtuele onderzoeksomgevingen en verrijkte weblectures.
Zie het programmaschema.
Zelf heb ik gekozen voor de track ‘profileren van onderzoek’ met presentaties over verrijkte publicaties, bibliometrisch onderzoek , Nature en over virtuele laboratoria en biodiversiteit.

Jan Gutteling van de Universiteit Twente vertelde over zijn verrijkte publicatie “Geen Paniek” , over hoe hij zo de levensloop van een publicatie kon aangeven. Hij is ertoe gekomen vanwege de vraag naar de valorisatie van onderzoek. Hij maakt gebruik van de tool ‘Escape( Enhanced Scientific Communication by Aggregated Publications Environments). De demo is erg mooi en hij heft dan ook terecht de Jaarpijs voor verrijkte Publicatie gewonnen.

Paul Wouters en college Rodrigo Costas van CWTS Leiden vertelden over hun binnenkort te verschijnen rapport. Daarin hebben zij een aantal webbased tools onderzocht die de impact van onderzoek(spublicaties) meten. Dat is nog niet zo eenvoudig, omdat de meeste niet aan alle criteria voldeden, criteria zoals: schaalbaarheid, transparantie (zelfgebruik data), en normalisatie (vergelijking crossdisciplinair). Onderzocht zijn bijvoorbeeld F1000 (niet volledig), MS Academic Search (geen naam-standaardisatie) en altmetrics tools als total-impact (alleen doi). Ook referereert hij aan Sure2 met impactgegevens over gebruik van repositories.
Wouters zegt uit te gaan van ' conceptual approach' first voordat er met alternatieve metrics kan worden gewerkt. Binnenkort komt er een handboek uit over de de klassieke methode va impactmeting.


Jason Wilde van Nature Publishing Group onderstreepte dat NPG geen tegenstander is van open access en zelf met Creative Common Licenties werkt.
Hij geeft in een mooie tijdlijn een overzicht van de geschiedenis van Nature: over ' Evolution of Nature' : van moeilijk vindbare oude covers tot genomics artikel met heel veel ' 'supplementary material'. Het artikel wordt wordt een 3d object , een ‘entity in information space’, met veel informative er rondom met extra data, metadata. . Hij gaat verder door over het data probleem over de data publication pyramid en kondigt aan dat nature ook over gaat op linked data. – We zijn benieuwd.

Willen Bouten van UvA IBED, Computational Geo-ecology, over e-Ecology (enhanced) over gedrag en verspreiding van soorten in relatie tot hun omgeving. Als nevenactiviteit bouwen zij virtual laboratories, waarmee zij hun onderzoek kunnen uitvoeren. Over samenwerkende natuurorganisaties in de Gegevensautoriteit Natuur, waar zij een datamodel hebben ontwikkeld voor alle natuurorganisaties met een nationale databank flora en fauna, zodat bouwend Nederland en anderen slecht bij een loket hoeven aan te kloppen. Ook het UvA Bird Tracking system is een aansprekend voorbeeld van het gebruik van virtuele labs en allerlei tools en systemen waarbij vliegbewegingen geïntegreerd worden met meteorologische gegevens. Er zijn systemen om meetgegevens te registreren, over te dragen en te visualiseren. Naast al die systemen is Bouten is nog op zoek naar virtuele samenwerking.

Richard Zijdeman sloot de dag plenair af met de opening van MyResearchPortal, een demoproject van Surf op basis van Surfconext. Zelf was ik van Surf Conext niet zo onder de indruk en hoewel Richard heel enthousiast is, legt hij wel de nadruk op de noodzaak tot educatie: er moet data workflow training komen in iedere master. En daar ben ik het helemaal mee eens. Bewustwording is beter dan een hele doos vol met gelikte tools.

De dag toonde wel aan dat ICT allang niet meer uitsluitend ter ondersteuning voor het onderzoek wordt gebruikt, maar een integraal onderdeel van het onderzoek uitmaakt. En het is interessant om te zien hoe er van de verschillende mogelijkheden gebruik wordt gemaakt. Een leuke, inspirerende dag.