23 sep 2009

Workshop Onderzoeksdata Knowledge Exchange -1

Main Drivers for Successful Re-Use of Research Data
Knowledge Exchange Discussion Workshop in Berlin September 23–24, 2009
WEDNESDAY, SEPTEMBER 23 • EUROPÄISCHES HAUS

De visie van Knowledge Exchange is
”” To make a layer of scholarly and scientific content openly available on the internet”
We worden ontvangen in het Europahuis bij de Brandenburger Tor, met een lunch van quiches en luxe mini-broodjes en –wraps.
Tijdens de lunch hoor ik over Australië, waar de data-opslag centraal geregeld is. En we spreken wat over de voor- en nadelen van het nationaal vs. Internationaal (en disciplinair) opslaan van data. Het gaat niet alleen om vertrouwen (in de software en de ondersteunende partij), maar ook om goede afspraken bijv. in een soort LOCKKS systeem, waarbij alle gegevens op meerdere plekken tegelijk worden opgeslagen. Het is me nog niet duidelijk hoe zich dat verhoudt met differentiatie en specialisatie van taken.
Er zijn ongeveer 45 mensen aanwezig, uit Duitsland, Engeland en Denemarken en ook al 5 Nederlanders gezien (van DANS, 3TUD, SURF en Universiteiten).
*
Na een introductie door 3 leden van de werkgroep Primary Research Data, volgt de key note speech van Ulf Leser van de Institute of Computer Science van de Humboldt Universiteit in Berlijn.

Social Issues in Scientific Data Exchange

Zijn belangrijkste punt is dat het delen van data geen technisch probleem is maar een sociaal-psychologisch probleem. Hij gaat uit van het knowledge management in bioinformatics. Het technische probleem is de informatie integratie en text mining, maar dat is oplosbaar. Hijhaalt een paar projecten aan, die slechts ‘lege’ systemen opleveren, omdat er geen duidelijk incentives waren om onderzoeksdata te delen, dan wel omdat er communicatieproblemen waren met de ge-outsourcete ICT.
De belangrijkste vragen zijn: waarom, wat en waarom niet? De hoe vraag is een technische en dus manageable probleem. Waarom zou je als onderzoeker je data delen: er zijn veel voordelen aan verbonden (kosten, herhaalbaarheid, kwaliteitscontrole, aanvullend..etc) en er zijn ook veel voorbeelden van succesvolle data sharing. Waarom werden die data gedeeld?: omdat er een noodzaak voor was (vanuit tijdschrift, vanuit fondsenverstreker), uit ijdelheid, voor erkenning, of vanuit overtuiging.
Vaak word de data pas gepubliceerd na de publicatie, en voor integratie (gelijktijdig voortbouwen) is dat al te laat.
Welke data wil je archiveren: ruwe data, normalized data, of de geanalyseerde data. Leser trekt daarbij een vergelijking met de welbekende driedeling in Kennis – Informatie - Kennis.
Daar zet hij ook de typen data tegen af: (integrated, confirmed) share in discussions, papers, information (interpreted) shared in databases, data (unbiased) share to increase trust.
De beschrijving van de context = metadata is onmisbaar, maar ook moeizaam zonder standaarden en gecontroleerde vocabularies (ontologies). Data is niet vergelijkbaar als context niet overeenkomt. Daarentegen zij er goede redenen om data niet te delen, voornamelijk voorkomend uit het idee dat je geen data, werk wilt weggeven.
Als aanbeveling geeft hij vooral mee dat de fondsen duidelijk eisen en gelden beschikbaar moeten stellen voor archiveren van data en dat er beneifits gecreeerd moeten worden voor de onderzoekers.
Een boeiende lezing.
*
[opmerkingen over sprekers na de key note verplaatst naar volgende blog}

Geen opmerkingen: