20 mei 2011

Open Onderzoeksdatadag

Open Onderzoeksdata dag van Surf georganiseerd in het Trippenhuis van de KNAW, maar georganiseerd door Surffoundation om te laten zien wat de diverse deelnemers als voor activiteiten ontwikkelen op het gebied van onderzoeksdata.
Directeur Surf opent Open Onderzoeksdatadag met beschrijving van populaire, maar al oude thema's: "cloud" en "open". De begrippen zijn niet nieuw en al tientallen (cloud/web) zo niet eeuwen (open) oud, maar de ontwikkelingen gaan traag, kijk bijv. naar de Berlin Declaration die toch al in 2003 door bijna alle partijen getekend is. Maar Open Access is nog niet echt doorgebroken. Wel veelbeleovend is het feit dat gisteren minister Verhagen van bij de opening vna de digitale agenda sprak over het inrichten van een Open Dataportaal voor overheidsinformatie. (zie info van ministerie, ook Neelie Kroes heeft over Europese open data geblogd)

De Keynote wordt uitgesproken door Jan Luiten van Zanden: “2+1 argumenten voor data-delen” over global economic history ofwel hoe overtuig je collega's van het belang van open opslag
Ook van Zanden is geennieuweling op dit terrein, zo heeft hij al in 2006 een basisartikel geschrven over samenwerking onder de titel ‘Do ut des. Collaboratories as a "new" method for scholarly communication and cooperation for global and world history” [Do ut des = Geef opdat gegeven zal worden] Hij leidt nu een groot project CLIO-INFRA, dat bestaat uit hubs, die samenwerken in collaboratoriess.
Wat zijn nu zijn argumenten voor open data:
- morele argumenten: voortgang van de wetenschap en maatschappelijke investeringen
- nieuwe publikaties mogleijk door samenwerking en vergelijkingen
- workshops voor uitdragen van kennis
- geld, aantrekken van nieuwe geldbronnen
- gezag en het verkrijgen van autoriteit
Hij komt met een mooi historisch voorbeeld over het onbedoeld gebruik van het VOC-archief, doordat bleek dat daat gegevens inzitten over bevolkinssamenstelling van Sri Lanka in die tijd.
De argumenten voor het delen van data zijn: efficiency, sommig onderzoek alleen mogelijk door vergelijking, disciplinerende werking Data Availability Policy [= eis van tijdschriften dat data gedeponeerd wordt).

Voorts komt Wilma Mossink van Surf. Zij bespreekt de rapporten van werkgroep Toegang tot Onderzoeksdata en geeft de handige verkote URL: http://www.surffoundation.nl/ToegangtotOnderzoeksdata . Dat is een iets andere link dan die naar de site van Open Onderzoek, die we (ik) eerder gebruikte.
Over de meeste heb ik geblogd in het kader van een bijeenkomst van het Onderzoeksdataforum.

Ze bespreekt ook al enkele rapporten, dioe nog niet gepubliceerd zijn, zoals het witboek dataprofessionals (werk ik zelf aan mee), DIPP over publiek private samenwerking en CARDS over veilig opslaan en gecontroleerd delen van data.
Ook stipt Wilma Mossink het project PersiD aan over persistente identifiers.
En de algemene aanbevelingen daaruit, voor NWO-KNAW, voor VSNU, voor de uitgevers en voor de instellingen. De deelnemers hebben dit allemaal op een A4-tje meegekregen, ik heb het in dropbox gekopieerd.

Theo Mulder, directeur onderzoek KNAW (en dus ‘onze’ hoofd-directeur) schets het KNAW-perspectief . Hij opent wel heel illustratief door Nederland te schetsen door de ogen van een Amerikaan als ‘shoppingarea’. Wat zijn de argumenten voor open onderzoeksdata? Mulder noemt drie argumenten:
- belastingbetalerargument,
- versnelling van wetenschap en
- kenniscrisis = aantasting legitimiteit van de wetenschap
Extra aandachtspuntje: bij de data zou ook de software open (open source) moeten zijn.
De rol KNAW is daarbij beprkt tot wat zij zelf voor de instituten voorschriven. Onlangs is er een beleidsnotitie ‘Open Access en Digitale Duurzaamheid’ uitgegaan ; er is geld gereserveerd voor Open Access, ieder instituut moet een datanotitie schrijven en iedere onderzoeksplan moet een dataparagraaf bevatten. Er is een ondermeer een flyer gemaakt met meer informatie. Mulder pleit ook voor schaalvergroting (internationalisering): een mogelijkheid om aan het ‘shoppingarea’effect te ontkomen.


Ron Deker van NWO belicht vervolgens het standpunt van de NWO. Ook zij zijn voor open data en ook hij stipt DANS aan het gezamenlijk instituut van KNAW en NWO, dat een voorziening biedt voor het opslaan van data. Hij haalt ook Minister Verhagen aan die die expliciet heeft gezegd "publieke data = open data = gratis data". NWO hanteert een duidelijk onderscheidt tussen publicaties en data. Bij data blijft NWO mede-eigenaar, data moet daartoe goed gedocumenteerd opslaan
NWO wil de bewustwording stimuleren.
Open data is het kunnen verschaffen van toegang (techniek) en het toegankelijk maken (juridisch-inhoudelijk). De beweegredenen van het delen van data zijn: kennisdelen en efficiency (hergebruik).
Als geldschieter kijkt NWO graag naar de efficiency van de subsidie :zij financieren liever één topfaciliteit dan 2 of 3 middelmatige. Zij zijn voorstander van goede citatie (kan door persistent identifier), en ziet problemen bij attributie (erkenning). Uit het publiek vertelt een deelnemer over het gebruik van ISBN aan datasets (bij taalkunde).

Peter Doorn van DANS spreekt als laatste over Dans en over “ Duurzame toegang tot onderzoeksdata”. Hij noemt Easy.dans.nl een soort Youtube voor onderzoeksdata. Hij verhaalt over de historie van Dans: uit 2005 en voorganger Steinmetz archief: over de functies als archief, advies- instelling , keurmerk. Dans heeft proef gedaan met data reviews (online) met een positief resultaat. Er is een rapport van op te halen op de op danssite.
Doorn geeft als aanbeveling mee, om onderzoeksdata te registreren in Research Information Systeem, actueel in Nederland is dat het Metis-systeem.

Ter afsluiting een paneldiscussie: Olv Leo Verdonschot

In 2 minuten mogen de panelleden een stelling verkondigen waarna een discussie volgt.
* Barend vd Meulen van Rathenau: Onderzoeksresultaten zijn niet uitsluitend afhankelijk van de meetbare prestaties. Ligt bij onderzoekers zelf, die kunnen niet meetbare resultaten, zoals datasets opnemen in zelfevaluatie.
* Karel Moons UMCU: Geneeskundig onderzoekers zijn huiverig om kennsi te delen. Ze zien op tegen het veel werk om gbegevens te anonimiseren. Maar ze zijn vooral bang dat ‘anderen’ meeliften met het vele werk dat zij gedaan hebben, zij zijn bang voor onkundig gebruik, onderuithalen van publicaties, who guards the guardians. Er zijn tijdsbeperkingen nodig( bijv. de tijd, die nodig is voor de originele onderzoeker om te promoveren) en publiceren Good Scientific Practice Guidelines
* IJsbrand Aalbersberg van Elsevier houdt zich bezig met het linken van publicaties met data. Elsevier is geen voorstander van copyright op datasets. Ze willen het liefst data in disciplinegeridchte repository met een aggregator als datacite. De data zo goed en rijk mogelijk linken op meerdere niveaus en binnen artikelkan dan een windowgeopend worden voor datarepository.
* Maria Heine, UKB en TUDelft van push naar pull: de 3TTU Datacentrum gaat samenwerken met Dans als centraal expertisecentrum (ev in overleg met e-sciencecentrum) en decentraal opgezet netwerk van locale frontoffice
Laatste vraag “waarom houden de instituten tegen webtrends in de informatie die zij met belastinggeld vergaard hebben voor zichzelf" Ze zien de directe winst niet en ‘voor de een een vak, voor de andere een hobby’

Interessante dag (presentaties en video staan online) , met name doordat het een soort state-of-the-art vertegenwoordigde van de grote financierende instellingen als NWO en KNAW. Waar staan we nu? Het antwoord is: “open als het kan beschermd als het moet”.
Ondanks het hoog mannen-in-pak-gehalte toch een gedenkwaardige middag, wat in ieder geval nog wel gevolg kan hebben voor de positie van de onderzoeksdata in Nederland met wat mij betreft als kernwoorden:
- Meer aandacht - bewustwording
- Zoveel mogelijk open
- Schaalvergroting
- Disciplinegericht

Geen opmerkingen: