24 aug 2010

Data management IPY

Op een mooie zonnige dag ben ik naar Texel gevaren om een bezoek te brengen aan het NIOZ (Nederlands Instituut voor Onderzoek Zee) en wel aan de Data Management Group en in het bijzonder die van de data management van het IPY.
IPY staat voor het International Polar Year. Het IPY 2007-2008 had een zeer divers programma met international polaire onderzoeken. Vanuit Nederland werden en 17 onderzoeksprojecten uitgevoerd.
Het NIOZ en in het bijzonder de DMG fungeert als Nederlands National Polar Data Center en had voor het managen van de data die uit die onderzoeksprojecten voortkomen een datamanager (Ira van den Broek) aangesteld.
In het Annual Report wordt onder het hoofdstuk Scientific Support Services een beschrijving gegeven van de activiteiten die in het kader van het IPY data management zijn verricht.
Ik was diep onder de indruk van de aanpak van zowel NWO (reserveert geld voor data management) als IPYDIS (IPY Documentation and Information Services, Internationale coördinatie) als DMG (uitvoering van Nederlandse IPY data management). Wat een mooie professionele aanpak!
Vanuit het IPYDIS wordt het internationale data management van het IPY gecoördineert. Zij bieden metadataportal, een data policy en ondersteuning van de nationale IPY data centers.
In juni heeft het IPYDIS een document gepubliceerd over de status van de data “The State of Polar Data—the IPY Experience”.
De IPY data strategy bestaat uit 4 elementen:
- Identify and share the data (identification)
- Serve the data in interoperable frameworks (availability)
- Preserve the data (preservation)
- Coordinate the process (coordination)
In juli 2010 was nog slechts een fractie van de data gepubliceerd.
Wel is duidelijk geworden dat specifieke data managers onontbeerlijk zijn bij het identificeren en publiceren van de data. Voor het registreren van de metadata kon gebruik worden gemaakt van de Global Change Master Directory van de NASA
Hun missie:


The mission of the Global Change Master Directory is to offer a high quality resource for the discovery, access, and use of Earth science data and data-related services worldwide, while specifically promoting the discovery and use of NASA data.


De GCMD biedt een interactief formaat voor het invoeren van metadata. De eigenlijke data kan worden opgeslagen in een gedistribueerd datacentrum en gelinked worden aan de GCMD.
Het voordeel van gebruik van een service als de GCMD is dat de metadata tamelijk uniform en gebruikersvriendelijk kan worden aangeleverd. Hoewel er uiteraard toch nog onderlinge afspraken nodig zijn. Er wordt in de GCMD gebruik gemaakt van diverse thesauri ofwel autorisatielijsten.
Toch bleek dat veel onderzoekers wel de hulp van een speciale data manager nodig hadden om alles efficient in te voeren.
Hoewel de doelen van de IPYDis niet helemaal gehaald zijn is wel duidelijk geworden dat data management een integraal onderdeel moet zijn van onderzoeksprojecten en bij voorkeur al van het begin moet worden opgepakt. En uiteraard ook expliciet gefinancierd.

Veel geleerd van dit bezoek: in ieder geval dat je het data management gecoordineerd moet aanpakken en zoveel mogelijk gestructureerd. En dat ondersteuning vna de onderzoekers daarbij noodzakelijk is. Dat blijkt ook weer uit een recente presentatie van Liz Lyon van UKOLN "Enabling research data management at the coalface".

De rest van het weekend genoten van Texel:


Geen opmerkingen: