Ecobibl

Weblog over mijn werk als informatiespecialist bij het Nederlands instituut voor ecologie (NIOO-KNAW).

24 apr. 2012

Over het gezag van de wetenchap

Dijstelbloem, H., & Hagendijk, R. (2011). Onzekerheid troef: Het betwiste gezag van de wetenschap. Amsterdam: Van Gennep. In deze bundel worden aan de hand van verschillende cases gekeken naar het gezag van de wetenschap. Aan bod komen onder meer de maatschappelijke discussie over Genetische Manipulatie, Baarmoederhalsvaccinatie, de ‘onverwachte’ bankencrisis’, de schuivende voedselvoorlichting,de falende forensische uitspraken, de kafkaiaanse systeemfouten in overheidsbestuur en de citizen science in leefexperimenten. Dat maakt de bundel heel divers, maar uiteindelijk komen Dijstelbloem en Hagendijk toch wel tot een eenduidige conclusie: het gaat niet zozeer om wetenschap an sich, maar om de maatschappelijke toepassingen ervan en arrogantie en ivoren toren-gedrag van wetenschappers werkt contraproductief.
Een aantal interessante punten worden aangereikt:
rol van het publiek: De ‘deficit hypothesis’, de idee dat het publiek domweg te weinig kennis en begrip heeft van wetenschap om zinvol deel te nemen aan publieke discussies en democratische besluitvorming leeft nog steeds onder de gevestigde wetenschappers. Inmiddels is toch wel duidelijk dat er beter naar het publiek moet worden geluisterd en met het publiek moet worden gecommuniceerd. Maar door ‘zelfoverschatting en chronisch gebrek aan institutionele zelfreflectie’ neemt de vervreemding tussen publiek en wetenschap alleen maar toe.
rol van de media : De scheiding tussen nieuwsvorming en beleidsvorming raakt vervaagd en dat leidt tot een ‘gemediatiseerde tijd”(-politiek – bestuur). De politiek van veelvoudigheden stelt dat gezaghebbend bestuur georganiseerd moet worden in een wereld van hyperrealiteiten, waarin politici meer dan eens zullen moeten reageren op incidenten en beelden en op betekenissen die anderen (..) toeschrijven.
houding van de ‘wetenschap’: In het debat over de HPV-vaccinatie voor meisjes speelt de Gezondheidsraad een rol in het communicatieproces die onzekerheid oproept. Ze presenteren zich als stem van de wetenschap, maar ze overstijgen de wetenschap in een poging tot oplossing voor een maatschappelijk vraagstuk te komen. Roger Pielke heeft de verschillende rollen van de wetenschapper beschreven in een vierveldentabel, waarbij de ‘pure scientist’ maar zelden voorkomt. De werkwijze van de Gezondheidsraad, de combinatie van wetenschappelijke gegevens en morele en politieke overtuigingen leiden tot een houding die Pielke noemt ‘stealth issue advocacy’. Door deze houding had het publiek het gvoel niet goed voorgelicht te zijn en ontstond er grote twijfel en onrust. Beter ware het geweest om de houding aan te nemen van ‘honest broker of policy alternatives’.m Dit had kunnen leiden tot meer openheid en overleg in samenstelling van het advies, waardoor er ook niet een gelijkluidend advies uit was gekomen, maar een aantal scenario’s.
rol van systemen: Twee hoofdstukken worden besteedt aan de waarde van de economische wetenschap, waarbij het voorspellen een belangrijke functie heeft. Aan de hand van geschetste modellen kunnen voorspellingen worden gedaan. Zaak is wel om dan alle factoren die van invloed zijn erbij te betrekken. Met als conclusie dat het vertrouwen in de economische wetenschap afhangt van de geldigheid van de gebruikte modellen. Noodzakelijk is een open leerproces en streven naar continue verbetering van systemen.
rol van voorlichting: In het hoofdstuk over voedselvoorlichting komt aan de orde dat het vertalen van uitkomsten van wetenschappelijk onderzoek naar verantwoord individueel dan wel collectief handelen nog niet zo eenvoudig is. De wetenschap die nodig is in de publieke ruimte betreft niet zozeer verschuivende zekerheden, maar zoekt nar goede manieren om onzekerheden te hanteren. En ‘In plaats van het lab te laten regeren over complexe praktijken, start zulke wetenschap vanuit die praktijken”.

Conclusie: ‘omgaan met onzekerheid in wetenschap, politiek en samenleving’.
De beschreven controverses zijn niet zozeer wetenschappelijke als wel maatschappelijke controverses. ‘wetenschap staat bij de burgers in hoog aanzien, de verwachtingen zijn hoog gespannen en de ermee geassocieerde potentiële persoonlijke, commerciële en collectieve belangen groot. Maar daarom wordt ook de schijn van partijdigheid en vooringenomenheid gemakkelijk gewekt en geëxploiteerd door burgers die afwijzend of argwanend staan ten opzichte van plannen, voorstellen en projecten. Er zijn allerlei aanwijzingen dat burgers wetenschap erg belangrijk vinden en veel vertrouwen hebben in wetenschappelijke instellingen. Maar tegelijkertijd zijn veel burgers uiterst wantrouwig als wetenschappelijke expertise lijkt te worden vermengd met commercie of politiek. “
En nog een laatste aardige zin:, “Dat het primair maatschappelijke kwesties zijn waarin wetenschap en technologie een belangrijke maar niet allesbepalende rol spelen, is een inzicht dat vooral wetenschappers nog wel eens over het hoofd lijken te zien. “

Ik lees zojuist dat de Jonge Akademie een advies m.b.t. wetenschapscommunciatie heeft uitgebracht. Tussen onderzoek en samenleving: Aanbevelingen voor optimale wetenschapscommunicatie. De Jonge Akademie. 2012 | 28 pagina's | ISBN 978-90-6984-643-9 | Gratis te downloaden.

5 apr. 2012

Library Camp: Unconference



Mijn eerste 'unconference': "Er is vantevoren geen inhoudelijk programma, alleen een raamwerk-agenda. Er zijn dus ook geen Powerpoints of andere slideshows.
Het is gebaseerd op de principes van OpenSpace."

De 'Open space' uitvoering was wat lastig (tussentijds veranderen van sessie was niet echt aan de orde), maar verder was het een echte unconference, een informeel samenzijn, waarbij er niet een persoon was die iets heeft voorbereid, presenteert en de discussie voorzit.
Het mooiste deel was meteen aan het begin bij het - uitgebreide - voorstel rondje.
Prachtig wat een mooie verzameling professionals.
We konden allemaal onszelf introduceren en aangeven wat we zouden willen bespreken tijdens die dag. Er waren zo'n 100 deelnemers en ik heb hieronder een kleine 58 onderwerpen genoteerd.


Daar werd een agenda van gemaakt verdeeld in 5 sessies. Iedereen kon zelf een sessie kiezen. Tijdens de sessies werd gediscussieerd over het onderwerp.
Uiteraard veel over de rol en de toekomst van de bibliotheek en de bibliothecaris.
Over klantvriendelijkheid en klantgerichtheid, over in contact komen met klanten, sociale media en rolmodellen. "De klant wil geen boormachine kopen: hij wil gaten boren".
Over de houding van de bibliothecaris als facilitator, als antenne, over het omgevingsbewustzijn: zowel bibliothecaris als klant moeten weten wat mogelijk is, oude structuren moeten worden doorbroken. Het ging over 'De klant is koningin' en over de 'Bibliotheek van 100 talenten'. Over 'gamen als katalysator', 'the floor is yours', het retail concept, de bibliotheek als studieruimte, als stekkerruimte, als stiltecentrum, als huiskamer.
- Wel leuk als die OB inbreng: ik heb nog nooit in een OB gewerkt, misschien toch nog eens proberen:) -
Maar ook wat te doen als je fysieke bibliotheek wordt opgeheven. Je verliest je focuspunt, de neutrale ruimte om contact te leggen met je klant. Moet je verder gaan als 'bibliografie'? De fysieke bibliotheekruimte bedoeld voor kennis delen, tools introduceren, waar je deskundig personeel vindt die je begeleidt naar informatie.

Helaas niet gesproken over inzet en taak in multimediale videoprojecten nog over businessmodellen voor open access. Maar het was een alleszins inspirerende bijeenkomst, waarbij ik veel mensen heb gesproken en veel heb gehoord waarover ik nog eens kan nadenken.
En dat alles terwijl het kampvuur brandt: op naar het volgende 'bibliotheek kamp'.
'Bibliotheek als begrip een heel sterk merk, dat moet je niet verkwanselen door allerlei modieuze naamgeving. In marketing-termen is het concept 'bibliotheek' ijzersterk.






22 mrt. 2012

Symposium Databeheer

Op donderdagmiddag woonde ik het symposium bij ‘Databeheer in de praktijk’. Laurens Sesink, de symposiumvoorzitter (DANS) introduceerde de middag door te constateren dat het onderwerp ‘beheer onderzoeksdata’ erg leeft en dat er veel bijeenkomsten over zijn. Dat kan ik bevestigen: ik heb zelf heel wat praatsessies meegemaakt over dit onderwerp (vanuit het Onderzoeksdataforum en in een poging om databeheer cursussen in de praktijk toe te passen) en ik zie ook heel veel nieuwe gezichten, maar ook een aantal bekenden, 35 in totaal.

CARDS: Controlled Access to Research Data Stored securely gaat vnl. over het beheer van onderzoeksdata ten tijde van het lopende onderzoek . Dus nog niet over duurzame opslag, dat is toch weer een ander (vervolg) verhaal.
Vanmiddag gaat het speciaal over het project CARDS. Er is een eindrapport verschenen en projectleider Ana van Meegen geeft daarover uitleg. Meerdere universiteiten hebben aan Cards meegedaan en hoewel de details verschilden per discipline is het algemene beeld toch wel overal hetzelfde (helaas nog steeds wat ikzelf al in 2007 constateerde): er is veel onwetendheid, veel onbegrip over wat mogelijk en voorhanden is en wat niet, ook m.b.t. de rol van de verschillende spelers: onderzoeker, ondersteuner, ict-er.
Uitgangspunten waren: de onderzoeker staat centraal, optimale ondersteuning, hands-on learning. Bedoeling is te komen tot een professionalisering van de ondersteuning (in eerder project was al eens geconstateerd dat onderzoekers ondersteuning wilden) en een inventarisatie van de wensen van de onderzoekers.

De ondersteuning kenmerkt zich door heel veel verschillen, in aard en niveau, vanuit bibliotheek, vanuit ICT, vanuit Research Support en met ook weer een keur aan benamingen waaruit de rapporteurs uiteindelijk met ‘dataspecialist’ naar voren kwam, maar tijdens de bijeenkomst bleek ook de ‘datasupporter’ als benaming wel over aanhangers te beschikken.
Onderzoekers blijken niet geïnteresseerd in verrijkte en/of open data. Onderzoekers willen bij voorkeur controle over hun data en zicht houden op wat ermee gebeurd. Ze willen minimaal tijd investeren en een vlotte technische infrastructuur en ondersteuning en advies bij metadatering, digitalisering en naast allerlei tips ook graag ondersteuning bij uitvoering.

De aanbevelingen van het CARDS project zijn:
- Zorg voor helder beleid
- Zorg voor goede ondersteuning
- Zorg voor bruikbare infrastructuur

Een van de concrete projectuitkomsten is de informatietoolbox voor het opzetten van een datamanagementplan. Deze toolbox kan vanaf de site van DANS worden gedownload.

De verschillende deelprojecten werden uitgevoerd op de verschillende universiteiten. Tijdens deze middag kregen we iets te horen over de projecten bij de UvA (Driek Heesakkers), UL (Peter Verhaar), UvT (Rob Grim) , UT (Maarten van Bentum) en VU (Peter Sol).
Zo bleek tijden de projecten in Amsterdam (UvA) dat er weinig bekend was, de pilot toonde de gaten in infrastructuur, en de onbekendheid met standaarden. Er waren veel vakgroepspecifieke vragen, en ook vraag ook om digitalisering en auteursrechtenkwesties.
In Leiden werd het project uitgevoerd door een VRE: virtual research environment op te zetten, met behulp van Sharepoint software, waarin de onderzoeker meteen kan uploaden geluidsopnamen en beschrijvingen toevoegen en gedetailleerde toegangsrechten regelen. Bij ondersteuning is meer vakkennis nodig en bij onderzoeker meer kennis van conventies, toch een positieve evaluatie met een helder idee voor vervolg i.s.m. 3TU.
Bij het Taxi-project in Tilburg ging het uiteindelijk over gebruik van internationale standaarden en software op gebied economische statistieken. Er blijkt weinig bekendheid over toch algemeen geldende standaarden zoals SDMX en open source software Fusion Registry.
In Twente werd een datacatalogue tool ontwikkeld in eXist voor intern beheer met goede zoekmachine, maar een Spartaanse gebruikersinterface. De ondersteuning zorgt voor basiskennis op gebied data management en de infrastructuur is primair. Een goede relatie met IT is essentieel.
De IT van VU heeft CARDS ingebed in DMS, het Document management Systeem waarbij giga- opslag bij onderzoeker blijft buiten de zoekmachine. Zij vinden dat capaciteit vanuit de centrale organisatie geregeld moet worden.

Na de presentaties van de projecten volgt een korte breakoutsessie, waarbij we in groepjes kunnen discussiëren over de aanbevelingen van het CARDS-project en dan m.n. wie is aan zet om welke noodzakelijke actie te nemen m.b.t. ondersteuning onderzoeksdata-beheer.
Uitgangspunt moet zijn speciale standaarden en metadata, die liefst centraal en internationaal gehanteerd worden, en verantwoordelijk financiers om eisen te stellen.
Ontbrekende en/of haperende infrastructuur, niet alleen technische, maar ook qua beheersorganisatie, moet op nationaal niveau worden aangepakt en er moet een uitspraak komen van Surf en eScience. Meer focus op delen en niet op archiveren, vakinformatie is noodzakelijk dus disciplinegerichte aanpak .

De rol van SURF in dit geheel was de uitvoering van het Surfshare programma. Als een vervolg wil Surf een Dutch Research Data Commons creëren, althans het draagvlak daarvoor onderzoeken met workshops en overleg. Het onderzoeksdataforum krijgt een vervolg als een Special Interest Group waarschijnlijk onder de naam Research Output.

2 mrt. 2012

Discovery services

Wat is een discovery service?
Een discovery service is een stap in de geschiedenis van het zoeken in bestanden.
Er is een opbouw zichtbaar in het zoeken in bibliotheekbestanden. Eerst had je alleen het zoeken in de bibliotheekcatalogus. Later kreeg je als bibliotheek ook toegang tot andere catalogi, tot de Nationale Catalogus (nu Picarta) en tot andere bestanden (bijv. Pubmed/Medline, Web of Science en journal platforms zoals Science Direct , Springer Link , Wiley Online en veel meer).
Dan rijst al snel de vraag “Kunnen we al die bestanden niet in één keer doorzoeken in plaats van een voor een.?”
Het begin van een Meta Search Engine, een zoekmachine die tegelijkertijd meerdere zoekmachines bevraagt en het antwoord dus tergugeeft uit diverse databases.
Een bekende toepassing van een meta search machine is de Metacrawler, een zoekmachine, die tot mijn verrassing nog steeds bestaat en tegelijkertijd zoekt in Google, Yahoo en Bing.
Toen de ontwikkeling wat verder gingen is de term Meta Search Engine een beetje uit de mode geraakt en is de term ‘Federated search’ geworden. In Wikipedia wordt aangegeven dat er wel een nuanceverschil is (Federated Search gebruikt beter de voor de betreffende database aangemaakte indexen dan Metasearch), maar de NISO (National Information Standards Organization – US) ziet ze als synoniem.

Het grote probleem zit hem ook altijd in de indexen. Als je optimaal gebruik maakt van de mogelijkheden van een bij een bepaald bestand behorende index dan zal je zoekresultaat ook beter zijn. Zo is bijv. Een ‘topic’ search in Web of Science niet te vergelijken met een Mesh-heading search in Pubmed, terwijl ze toch beide zoeken op een onderwerp. Maar waar topic in WoS allerlei, niet gestructureerde woorden uit de titel en het abstract kan bevatten, zijn de Mesh-headings scherp gedefinieerde trefwoorden die in een gestructureerd verband met elkaar nog kunnen worden ingeperkt en/of uitgebreid. Gebruik van de eigen indexen voor een bestand is dan ook aan te bevelen, dat was zeker zo in de tijd van vóór het full-text zoeken. De zoekalgoritmen zijn sterk verbeterd.

Discovery services (of Web-scale discovery) gaan een stapje verder en gaan uit van een eigen gezamenlijke index voor diverse bestanden. Je zoekt in één index en je krijgt geïntegreerd uit een aantal bestanden het antwoord terug. In de Federated Search Blog geeft auteur Sol een aardige uitleg over discovery services (uit 2009) en Jason Vaughan heeft het in American Libraries uit 2010 over Web-scale Discovery.

Er zijn een aantal commerciële aanbieders van discovery services. Dat zijn intermedairs die contacten en licenties hebben afgesloten met uitgevers om de inhoud van hun databases te gebruiken om een ‘unified index’op te bouwen. Zij bieden een centrale service aan en daar kun je dan je eigen databases aan toevoegen. De oplossing is ‘in the cloud’d.w.z. op de servers van de aanbieders.
Aanbieders zijn:
Primo (Exlibris), Ebsco iscovery Service (EDS) , Summon (Serials Solutons) en nog een lijstje (zie de site Unified Resource Discovery Comparison van Lukas Koster en Andy Ekins) soortgelijke aanbieders. Opmerkelijk is dat het meestal gaat om tijdschriftagenten, dan wel leveranciers van link solvers of soortgelijke koppeling van tijdschriftenartikelen metadata aan de full text.

Op 26 januari zijn we in vergadering bijeengeweest, met een aantal KNAW-instituten om de mogelijkheden te bekijken en te bediscussiëren van discovery services. Als gast was daarbij aanwezig Lucas Koster van de UvA. Lukas vertelde ons over het selectieproces en de implementatie van de Primo Discovery Services bij de Universiteitsbibliothehttp://www.blogger.com/img/blank.gifek Amsterdam.

Ter voorbereiding konden we het artikel over Discovery Services uit Library Technology lezen en diverse discovery services raadplegen.
Na de bijeenkomst bleven nog genoeg vragen over. Een van de leukste was die van een van de KNAW-collectie-instituten, die zelf veel databases maken, over de mogelijkheid om al de eigen databases met een unified index toegankelijk te maken.
Nu resten ons de vragen van onze licentie-manager te beantwoorden:
Hier volgen de vragen:
1. Wie heeft wat aan een DT? Waarom?
2. Wat gaat er mis voor wie zonder een DT? Waarom?
3. Voor wie is een DT niet interessant? Waarom?
Stel dat een DT nuttig is:
4. Wanneer een DT?

En die ga ik komend weekend maar eens beantwoorden.

15 feb. 2012

Surf Onderzoeksdag


De ondertitel van deze dag luidt: “Inspiratie voor ICT-gebruik in onderzoek” en in de beschrijving van de dag staat: “ Op de SURF Onderzoeksdag laten onderzoekers zien hoe ICT-methoden en -hulpmiddelen wetenschappelijk onderzoek, en de presentatie daarvan, kunnen verrijken en vernieuwen.”
In een uitverkocht MediaPlaza (van de Jaarbeurs) druppelden de 200 deelnemers wat verlaat binnen i.v.m. de aangepaste NS-dienstregeling vanwege het winterweer. Jammer dat er na een uurtje staan in de trein nauwelijks zitgelegenheid is in Media Plaza om koffie te drinken, maar gelukkig was er wel – gratis – wifi en ik heb zelfs een stopcontact gevonden.
Over het onderwerp was ik een beetje op het verkeerde been gezet, omdat ik de uitnodiging voor deze dag vanuit de SurfShare maillijst had gekregen. En ik was betrokken bij het onderzoeksdataforum als onderdeel van SurfShare, dus tot vlak voor de dag was ik in de veronderstelling dat het om onderzoeksdata ging. Maar SurfShare was natuurlijk veel breder. Hoewel ik het niet meer expliciet zie sta, dacht ik wel dat deze dag een afsluiting van SurfShare betekende. Het gaat daarbij op ‘open onderzoek’ met trefwoorden als open access, collaboratories, verrijkte publicaties , samenwerking en dus ook toegang tot onderzoeksdata.
De opening stond in het teken van open access met een flitsende keynote van Cameron Neylon, die blogt onder de titel “Science in the Open”. Neylon is werkzaam bij de Science & Technology Council (onderdeel van de Research Council UK). Een groot deel van de tekst van zijn lezing is te vinden in zijn blogpost getiteld ” Network Enabled Research: Maximise scale and connectivity, minimise friction”.
Het komt erop neer dat met Internet en de oneindige connectiviteit een efficiënte transfer van informatie mogelijk is. Zo’n netwerk maakt het mogelijk om ook onderzoek op een kwalitatief hoger plan te brengen, zie de voorbeelden van crowd sourcing op wiskundig en astronomisch terrein.
Ook in Nederland is dat aan de gang. Ik las gisteren over het project Vele Handen.nl, waarbij het Stadsarchief Amsterdam i.s.m. met enkele bedrijven het publiek vraagt mee te helpen met het indexeren van archiefstukken, en de resultaten zijn overweldigend. De website Velehanden.nl heeft op 14 februari de Geschiedenis OnlinePrijs gewonnen.
Terug naar Neylon, die dus in de connectiviteit van het netwerk een mogelijkheid ziet op op grotere schaal onderzoek te doen. Neylon zegt dat we nu te maken hebben met netwerken die zorgen voor een enorme toename van kwalitatieve onderzoekscapaciteit . Onderzoek waarin ook de ‘gewone’ burger geïnteresseerd is, d.w.z. in het effect van het onderzoek, niet in de wetenschappelijke papers. Maar die papers zijn wel het noodzakelijke communicatiemiddel tussen de ‘ruwe data’ van onderzoek en het feit dat de uitgevers een businessmodel hanteren van betaalde toegang tot die papers veroorzaakt weerstand in het systeem van netwerk-connectiviteit.

“Currently we take raw science and through a collaborative process between researchers and publishers we generate a communication product, generally a research paper, that is what most of the community holds as the standard means by which they wish to receive information. Because the publishers receive no direct recompense for their contribution they need to recover those costs by other means. They do this by artificially introducing friction and then charging to remove it.”


Want wat zijn de voorwaarden voor voor soepele en efficiëntie onderzoeksnetwerken:
1. Schaal en connectiviteit [internet en webservices]
2. Lage weerstand bij informatie-overdracht [geen betaalde toegang]
3. Filters aan vraagzijde [de gebruiker bepaalt, niet leverancier; de gebruiker aggregeert, index en reviewed]
Nog wat interessante uitspraken van Neylon:
“At the scale of a network you can manufacture serendipity”
“The content industry is dead”

Na de inspirerende voordracht van Cameron Neylon onderstreepte Jos Engelen van NWO nog eens het belang van open acces. Het is, zei hij een logische gedachte dat door openbaar geld gefinancierd onderzoek ook openbaar toegankelijk is, al dan niet meteen. En uiteindelijk gaan we het winnen van uitgevers.
Volgens Engelen is "escience" belangrijk maar niet alles. Hij ondersteunt het Nederlandse eScience Center (door NWO en Surf samen opgezet) , maar daarnaast zijn ook andere investering in de ict-infrastructuur nodig. Hij verwijst naar de Roadmap ICT voor de topsectoren.

Na de lunch werden de vijf parallele sessies gestart. Er was een sessie over tekst en taal met presentaties over e-Humanities en nanopublicaties; een sessie over data met presentaties over ‘Big data”Mess Project en CARDS. In de sessie Beeld en Geluid ging het over misicologie en virtual en augmented reality. In de sessie over Onderzoek en onderwijs over opleiding tot datascientist , virtuele onderzoeksomgevingen en verrijkte weblectures.
Zie het programmaschema.
Zelf heb ik gekozen voor de track ‘profileren van onderzoek’ met presentaties over verrijkte publicaties, bibliometrisch onderzoek , Nature en over virtuele laboratoria en biodiversiteit.

Jan Gutteling van de Universiteit Twente vertelde over zijn verrijkte publicatie “Geen Paniek” , over hoe hij zo de levensloop van een publicatie kon aangeven. Hij is ertoe gekomen vanwege de vraag naar de valorisatie van onderzoek. Hij maakt gebruik van de tool ‘Escape( Enhanced Scientific Communication by Aggregated Publications Environments). De demo is erg mooi en hij heft dan ook terecht de Jaarpijs voor verrijkte Publicatie gewonnen.

Paul Wouters en college Rodrigo Costas van CWTS Leiden vertelden over hun binnenkort te verschijnen rapport. Daarin hebben zij een aantal webbased tools onderzocht die de impact van onderzoek(spublicaties) meten. Dat is nog niet zo eenvoudig, omdat de meeste niet aan alle criteria voldeden, criteria zoals: schaalbaarheid, transparantie (zelfgebruik data), en normalisatie (vergelijking crossdisciplinair). Onderzocht zijn bijvoorbeeld F1000 (niet volledig), MS Academic Search (geen naam-standaardisatie) en altmetrics tools als total-impact (alleen doi). Ook referereert hij aan Sure2 met impactgegevens over gebruik van repositories.
Wouters zegt uit te gaan van ' conceptual approach' first voordat er met alternatieve metrics kan worden gewerkt. Binnenkort komt er een handboek uit over de de klassieke methode va impactmeting.


Jason Wilde van Nature Publishing Group onderstreepte dat NPG geen tegenstander is van open access en zelf met Creative Common Licenties werkt.
Hij geeft in een mooie tijdlijn een overzicht van de geschiedenis van Nature: over ' Evolution of Nature' : van moeilijk vindbare oude covers tot genomics artikel met heel veel ' 'supplementary material'. Het artikel wordt wordt een 3d object , een ‘entity in information space’, met veel informative er rondom met extra data, metadata. . Hij gaat verder door over het data probleem over de data publication pyramid en kondigt aan dat nature ook over gaat op linked data. – We zijn benieuwd.

Willen Bouten van UvA IBED, Computational Geo-ecology, over e-Ecology (enhanced) over gedrag en verspreiding van soorten in relatie tot hun omgeving. Als nevenactiviteit bouwen zij virtual laboratories, waarmee zij hun onderzoek kunnen uitvoeren. Over samenwerkende natuurorganisaties in de Gegevensautoriteit Natuur, waar zij een datamodel hebben ontwikkeld voor alle natuurorganisaties met een nationale databank flora en fauna, zodat bouwend Nederland en anderen slecht bij een loket hoeven aan te kloppen. Ook het UvA Bird Tracking system is een aansprekend voorbeeld van het gebruik van virtuele labs en allerlei tools en systemen waarbij vliegbewegingen geïntegreerd worden met meteorologische gegevens. Er zijn systemen om meetgegevens te registreren, over te dragen en te visualiseren. Naast al die systemen is Bouten is nog op zoek naar virtuele samenwerking.

Richard Zijdeman sloot de dag plenair af met de opening van MyResearchPortal, een demoproject van Surf op basis van Surfconext. Zelf was ik van Surf Conext niet zo onder de indruk en hoewel Richard heel enthousiast is, legt hij wel de nadruk op de noodzaak tot educatie: er moet data workflow training komen in iedere master. En daar ben ik het helemaal mee eens. Bewustwording is beter dan een hele doos vol met gelikte tools.

De dag toonde wel aan dat ICT allang niet meer uitsluitend ter ondersteuning voor het onderzoek wordt gebruikt, maar een integraal onderdeel van het onderzoek uitmaakt. En het is interessant om te zien hoe er van de verschillende mogelijkheden gebruik wordt gemaakt. Een leuke, inspirerende dag.

15 jan. 2012

Afscheidssymposium Eric Sieverts

Vrijdag 13 januari 2012 werd in het Kohnstammhuis (voormalige gebouw van de Amsterdamse Belastingen, nu HvA) het afscheidssymposium gehouden ter gelegenheid van de pensionering van Eric Sieverts.
Vanuit de zaal op de 9e verdieping heb je een prachtig uitzicht over het bouwterrein van waar eerst het Wibauthuis stond aan de andere kant van de Wibautstraat. En aan de andere kant kijk je richting Amstel en de torens van het Rijksmuseum.
Eric Sieverts, werkzaam bij de Universiteitsbibliotheek Utrecht en de Hogeschool van Amsterdam heeft zich ontwikkeld tot dè zoekspecialist van Nederland. Hij werkte mee aan de Vogin-cursus ‘Online opsporen van informatie’, waarvan ik een aflevering heb gevolgd in 1990, maar die nog steeds ge-update wordt en wordt gegeven. Eric is ook bekend geworden van zijn columns in de Informatieprofessional, het vakblad voor bibliothecarissen en mensen die in de informatiesector werken.
Het symposium met als thema “Op zoek naar de toekomst; wat 30 jaar ervaring over de volgende 30 jaar kan zeggen" trok een volle zaal.
Er werden drie lezingen gehouden: Cees Snoek over beeldretrieval, Wouter Gerritsma over zoekmachines en Eric Sieverts zelf over het vinden van informatie. Daarna de afscheidstoespraakjes en felicitaties. Het geheel eindigde met een borrel en lichtkransjes voor de gasten.
Eric kreeg een digitaal gastenboek aangeboden waarin de gasten ieder een blogtekstje hadden kunnen schrijven ter herinnering.

Beeldretrieval
De toekomst van het zoeken duidt al enigszins op andere manieren van zoeken, dus niet alleen maar tekst, maar ook beeld. Cees Snoek, medewerker aan het Instituut voor Informatica van de UvA doet onderzoek naar video en beeld retrieval, zoals hij op zijn website aangeeft. Probleem bij het zoeken naar beelden begint al bij het labelen (beschrijving of typering van de herkenningspunten) van beelden. Een mens ziet meteen een aantal kenmerken op een afbeelding, maar voor een computer is dat lastig. Het eenvoudigste niveau om beelden te benoemen is door ‘concept detection’. Je geeft de computer een aantal voorbeelden en die ‘leert’dan het concept te herkennen. De kenmerken zijn op het gebied van kleur, textuur, vorm en beweging, Die kenmerken moeten ‘invariant’zijn, dus niet door toevalligheden veranderen (zoals schaduw). Snoek toont een grafiek, waarin hij aangeeft dat de waarschijnlijkheid op goede match berekend kan worden met een Support Vector Machine in 1995 uitgevonden door Vladimir Vapnik. [Als je dat in wikipedia opzoekt kom je op een pagina met voor niet-wiskundige tamelijke ingewikkelde formules].
Voorheen maakte idereen gebruik van eigen datasets, maar sinds 2001 is er TRECVID, dat datasets levert die iedereen kan gebruiken. Het uit de wereld van de information retrieval bekende TREC systeem zorgt voor uitdagingen en probleemstellingen die in een jaarlijkse conferentie bestaande uit workshops aan elkaar worden getoetst. Zo kan het onderzoek snel voortgang boeken.
Een van de uitdagingen van TRECVID, waaraan hij met Media Mill, semantic video search engine, deelneemt is dat naar video indexing, methoden om multimedia te analyseren. In een demo laat hij zien hoe dat in zijn werk gaat. Fascinerend om te zien, dat de computer sommige beelden wel herkent en goed indeelt en andere niet. Maar van de fouten kan ook de computer leren.
Bijvoorbeeld. De zoekmachine heeft door voorbeelden ‘geleerd’ wat een boot is (blauw vlak met gat) en kan zo in de zoekopdracht voor boot, de diverse plaatjes met een boot eruithalen. Als fout ook booreiland, auto in ondergelopen straat.
Ook de andere voorbeelden die hij aanstipt spreken tot de verbeelding, bijv. vergelijk alle foto’s op Flickr met tags en besluit op basis van gemeenschappelijke tags tot een gemeenschappelijk trefwoord. En ook het crowdsourcing door publiek online concerten te laten ‘taggen’.
Er zit hier zeker nog wat in het vat voor de toekomst.

Toevalligerwijs kwam later op de avond op Twitter een vogel-determinatie-app ter sprake:

Zoiets bestaat trouwens al voor bomen (in de USA) Leafsnap.
En in NRC van zaterdag 14 januari geeft Folkert Jensma in zijn Recht en Bestuur column een juridische beschouwing over gezichtsherkenning. Boeiend allemaal.

Zoekmachines
Als tweede spreker gaat Wouter Gerritsma van de WUR en VOGIN, in op de ontwikkeling van zoekmachines onder de prikkelende titel: "Instant satisfaction in the library”.
Na een hilarische inleiding waarin hij duidelijk aangeeft dat bibliotheekcatalogi niet meteen een makkelijke toegang tot een full text boek (als voorbeeld The Fourth Paradigm) zijn gaat hij verder over zoekmachines. Hij memoreert de beroemde cursus 'Online opsporen van informatie', waarvan de 67e aflevering uit 2010 op de Vogin wiki is te vinden. Hij laat de - op typemachine getipte aankondiging zien van de Lycos-cursus door Eric Sieverts uit 1995.

Na de komst van Google wordt de Google interface min of meer leidend. Wouter toont dat met al het more en more klikken je ook bij Google nog niet alle Google applicaties kunt vinden. Hij noemt het ´het bibliotheekprobleem van Google´ ook niet altijd instant satisfaction dus. Ook zijn de zoekresultaten bij Google niet erg consistent, afhankelijk van je manier van inloggen, je landenversie etc.
Zo moet het dus ook niet, maar hoe dan wel?


Vinden in tijden van informatieovervloed
Eric Sieverts zelf spreekt over 'Informatie vinden en selecteren in tijden van informatieovervloed'. Een cijferoverzicht: de exponentiele groei van het aantal wetenschappelijke publicaties (iedere 14 jaar een verdubbeling); jaarlijkse verdubbeling van aantal gecoverde pagina's door webzoekmachines (wordt niet meer bijgehouden nu); jaarlijkse verdubbeling van aantal bytes dat iedereen produceert.
Wat betreft wetenschappelijke publicaties wordt een overstap gemaakt naar andere manieren van publiceren zoals op weblogs, nanopublicaties in triples.
SearchEngineWatch, de site waar Eric altijd veel info vandaan haalde is opgehouden met aantal pagina's te tellen.
En als we de infographic van bijv. ReadWriteWeb mogen geloven dan is de hoeveelheid data (bytes) in 2015 gegroeid tot het equivalent van 18 miljoen keer de Library of Congress. [Maar aldus Eric infographic = overtreffende trap van statistics].
Video is het snelst groeiend, al in 2005 was de helft van alle materiaal video, maar als het zo doorgaat in 2210 het aantal bytes bereikt dat netzoveel is als het aantal atomen op aarde.
Zo ver zal het dus wel niet komen....

De ontwikkeling in het online zoeken is van de robuuste online hosts als Dialog naar het bekende, maar onbetrouwbaardere zoeken met Google gelopen. De sociale media, zoals Facebook en Twitter worden steeds belangrijker als zoekingang en ook allerlei vormen van gepersonaliseerd zoeken. Dat levert het gevaar op van de ´filter bubble´ (je krijgt alleen informatie van binnen je eigen club).
[Tijdens mijn verblijf in de USA in de jaren 80 viel het mij al op dat op het platteland daar mensen alleen de lokale sufferdjes lazen en geen 'echte' kranten en ze dus ook nauwelijks weet hadden van 'de wereld en het wereldnieuws'.]
Ook in het literatuuronderzoek is het nodige veranderd: van de gedrukte abstract journals naar het online zoeken. Eric heeft in Utrecht meegeholpen een makkelijke enkelvoudige zoekingang te creëren "Omega", eigenlijk al een discovery service avant la lettre.
En de toekomst: weet in 2020 Google al het antwoord door rechtstreekse koppeling met ons brein?
Grote vraag blijft voor Eric of al deze ontwikkelingen van sneller, beter vindbaar ook hebben bijgedragen aan een betere kwaliteit van het werk?
Zijn lezing over 20 jaar werkzaamheden voor de afdeling Innovatie & Ontwikkeling van de Universiteitsbibliotheek Utrecht laat wel zien dat we 30 turbulente jaren achter de rug hebben, en dat de toekomst nog een open vraag blijft.

Of Eric Sieverts na zijn pensionering stil achter de geraniums kruipt lijkt niet aan de orde gezien zijn recente tweet:




En dat is maar goed ook, we hopen allemaal nog veel van hem te horen en te lezen!

21 dec. 2011

Import uit Refworks

En dan probeer ik een bestand uit Refworks te importeren in Endnote.
Dat geeft wel weer de nodige aanpassingen. Uiteindelijk lukt het het beste om het Refworks-bestand te exporteren als 'Tagged Refworks - format'.
Het aardige van zo'n tagged format is dat je een overzicht van de tags erbij krijgt.

Dan het importeren in Endnote volgens het commando File - Import met als optie Refworks-import.
Ik heb wat User-Defined Fields en die staan in het standaard Refworks-importfilter van Endnote op {IGNORE}. Maar daarom heb ik ze niet gemaakt.

Die User-defined Refworks fields wil ik ingelezen hebben in Custom-fields in Endnote.






Het lastige is dat Endnote erg inconsequent omgaat met de custom-fields. In sommige 'reference types' worden die custom-fields doodleuk gebruikt voor andere veldbenamingen. En dan lukt import niet.

Zaak is dus om eerst in Endnote alle reference types zo aan te passen dat de custom-fields ook Custom 1, Custom 2 etc. heten. Dat doe je via Edit - Preferences - Reference types en dan per stuk Modify Reference Type. Achter de gekozen veldnaam moet dan staan hoe die veldnaam in dat document type moet gaan heten (dus Custom 1 = Custom 1).
Er is wel een optie "Apply to all reference types", maar die werkt niet voor die benamingen die al ingevuld zijn, dus daar heb je niets aan.

De tweede stap is om het import-filter aan te passen. Via Edit - Importfilter kies je het Refworks-Importfilter en maakt eerst een kopie.
Je kiest 'Templates' om de matchende velden te bewerken, en dat doe je weer voor ieder reference type. Gelukkig kun je het ook kopiëren en plakken(Ctrl+C en Ctrl+V).

Dan nog in de Field editing aangeven dat ik in Custom 8 geen kleine letters wil en ik kan alles netjes inlezen.

[In Refworks klikte ik weer per ongeluk op Help en in plaats van een helptekst krijg je dan een akelige herenstem die je probeert iets uit te leggen. O gruwel!
Als je in de rechterzijbalk onder Quick Access iets aanklikt en dan op Help krijg je wel een geschreven helptekst, ze kunnen het dus wel en die engerd is helemaal niet nodig.
]