Woensdag 7 april 2010 de 4e bijeenkomst van het Onderzoeksdataforum.
De animo loopt duidelijk wat terug, er zijn minder mensen en uit de korte verslagen van de werkgroepleiders blijkt dat er – zeker m.b.t. uitvoering – weinig menskracht beschikbaar is.
3 TU kondigt een workshop aan “Digital Curation: training & workshop” op 23 april in Delft
Surf heeft op 28 april een rondetafel bijeenkomst met beleidsmensen van Surf over datamanagement beleid: er is een checklist in opzet.
De middag begint met de presentatie van Titia van der Werf van de IISG van de “IISH Guidelines for preserving research data: a framework for preserving collaborative data collections for future research” SURFshare programme 2007-2010, WP7 Datacuratie en digitale duurzaamheid
Ze legt uit aan de hand van de context-beschrijving van hoe het IISG in elkaar zit hoe de richtlijnen tot stand gekomen zijn. Uitgaande van de individuele onderzoeker, die een dataverzameling opbouwt en ook een relatie met het documentatiecentrum heeft. Die later ook zijn dataverzameling aan het centrum ter beschikking stelt voor hergebruik. Kenmerkende elementen hieruit zijn: behoeften van onderzoekers: extraheren van gegevens uit dataverzamelingen, collaboratories, bewaarplaatsen.
Collaboratories en bewaarplaatsen groeien naar elkaar toe in behoefte aan gedeelde onderzoeksfaciliteit: dynamische dataset, groter en internationaler, structurele kosten
Er zijn aardig wat collaboratories en data hubs bij IISG.
Vanuit bronnen maak je gegevensverzameling, dat is laag 0, daaruit maak je een brongetrouwe dataset in laag 1, daar zit wel metadata bij, maar is nog niet geschoond.
In laag 2 schoon je de data, ontdubbel en anonimiseer je die. In laag 3 kun je dan analyseren en de gegevens bewerken.
De richtlijnen zijn gebaseerd op DDI v2, maar bijv. voor versiebeheer is v3 nodig. De richtlijnen zijn vrnl theoretisch kader.
Vervolgenss geeft Gera Pronk van Surf een introductie in E-IRG (e-infrastructure reflection Group) Data Management Task Force report. Als ik goed geteld heb worden er in e-IRG DTMF report 62 programma's genoemd, allemaal met eigen acroniem. Geeft overzicht EU initiatieven. Het rapport geeft uiteindelijk 21 aanbevelingen, waarvan een flink aantal in de categorie ‘open deur’.
Een aantal ook gaan over terminologie, semantisch web, linked data en dat brengt de discussie op ISO 11179, dat een definitie geeft over terminologie voor metadata. En zo komen we op Isocat. Er is ook een website over ISO TC 37 Terminology.
Naar aanleiding van dit E-ISG rapport heeft Wilma Mossink 5 stellingen opgeschreven waaraan alle deelnemers via dotmocracy methode kunnen aangeven wat ze er van vinden:
- Rol Surf: vertaalslag buitenlandse initiatieven – verschil in financiering (geen subsidie als de data niet gedeponeerd is)
- Rol Surf: guidelines voor uitwisseling – faciliteert
- Metadata: flexibele standaard
- Hergebruik: ieder onderzoek specifiek
- Opslag: cloud computing
- Kwaliteit: data repository kan weigeren
In groepjes bediscussiƫren wij de aanbevelingen. Bij de eindbespreking blijken de meningen nogal uiteen te lopen. Iedereen is er wel over eens dat de aanbevelingen van de E-IRG niet rijp zijn om zomaar breed verspreid en besproken te worden. Daarvoor zijn ze toch te onduidelijk en te controversieel. Vraag is natuurlijk ook of er disciplineoverstijgende aanbevelingen te maken zijn. Wellicht is daarvoor het onderzoek toch te specifiek. En m.i. is het ook lastig om over de beperkingen van de huidige situatie op organisatorisch en technologisch vlak in de toekomst te kijken. Kwaliteit is wel een issue. Ook de kwaliteit van metadata, maar wie beslist uiteindelijk wat slechte kwaliteit is. Wel is het nodig om kwalitetiscriteria ontwikkelen.
Gera gaat een white paper schrijven over data management. Ook vanuit Knowledge Exchange zal een white paper worden geschreven, en zelfs vanuit ons werkgroepje gaan we een white paper schrijven.
White paper: de oplossing voor alle problemen??
In wikipedia: Een witboek of white paper is een technisch document dat beschrijft hoe overheidsbeleid, een technologie, en/of product een specifiek probleem oplost. Witboeken worden gebruikt om de lezer van objectieve relevante informatie te voorzien die wordt gebruikt voor het nemen van een beslissing]
Geen opmerkingen:
Een reactie posten