30 apr 2010

Emtacl10 Linked Data Libris

emtacl10:emerging technologies in academic libraries
In de linked-data-wolk staat LIBRIS, de Zweedse Centrale Catalogus als deelnemer bovenin het plaatje, liet Anders Söderbäck ons zien in zijn presentatie “Why cultural institutions should care about linked data: a case for openness”. 2 jaar geleden zijn ze uitgenodigd om deel te nemen aan Dbpedia. En nu linken ze vanuit de catalogus naar externe bronnen en geven suggesties.
Anders' definitie van Linked data =

“best pratices for the semantic web, method to expose, share and link data with uri’s.”

Hij begint met de geschiedenis van het idee van Tim Berners-Lee tot linked-data-goeroe Kingsley Idehen data 3.0 Manifesto for platform agnostic structured data
Boek: Pull: Power of the semantic web van David Siegel beschrijft o.m. de “sematic web acid test”, waarmee je kunt testen of iets echt voor het semantisch web is met als kernvragen: is het semantisch, is het op het web
Wat je als bibliotheek doet moet passen in de context: je moet dus niet doen wat de bibliotheek wil (bijv. z39.50), maar wat de mensen in wereld daarbuiten willen. Je moet onderdeel worden van het grotere netwerk. En blij zijn bijv. als mensen je catalogus willen hacken. En je moet aan de grotere vraag naar api’s voldoen
De toekomst, aldus Anders is een voortdurend werk-in-uitvoering, je moet zelf aan je positie en aan de systemen blijven werken. Als je het zelf niet doet dan zul je het moeten doen met de systemen die je krijgt, en niet met de systemen die je wilt
Als je zelf je informatie (catalogus) gereed maakt voor Linked data, dan moet je andere ook toestaan met jou te linken, dan pas werk je in een netwerk.
Enkele andere organisaties die met Linked data werken zijn bijv. CrossRef Tech: DOI’s kunnen worden gepresenteerd als Linked data ; VIAF virtual International authority File. En het internationale en interorganisationele initiatief om tot een unieke auteursidentifier te komen ORCID Die combinatie van DOI’s, autorisatie en identifier opent veel mogelijkheden voor literatuurbeheersing met linked data.
Hij vervolgt zijn praatje met een pleidooi voor openheid, en vergelijkt een gesloten wereld met een open wereld. Openheid is niet per definitie beter. Maar er is wel een verschuiving in ‘mindset’ nodig van het idee “we hebben informatie en die kunnen we toegankelijk maken” naar “ informatie die er is is in principe voor iedereen, maar wellicht moet toegang tot sommige informatie beperkt worden”.
Vanuit de Open Knowledge Foundation en de definitie die zij geven van “openheid” stipt hij de typische problemen aan zoals die worden beschreven in historisch overzicht van de World Internet Host, de European Interoperability Framework, conflicterende licenties (of bijv. om de haverklap op ene kaart vragen om acceptatie van de licentievoorwaarden zoals bij open street maps) en open data commons.


Problemen liggen vooral bij het niet aangepast zijn:
- bibliotheeksystemen zijn niet aangepast aan linked data,
- juridsch framework is ook niet aangepast aan linked data,
- bibliografisch gedachtengoed is niet aangepast aan linked data.
Discussie:
- open netwerken reiken verder dan ommuurde tuinen
- sterke netwerken hebben meer dan een knooppunt nodig
- verdubbeling is niet noodzakelijkerwijs een probleem
- goed genoeg is beter dan perfectie

Goede presentatie, ondanks zijn stijve uitstraling bleek Anders Söderbäck erg humorisitisch en zijn verhaal is m.i. een glashelder betoog voor het koppelen van gegevens in een open netwerk.


28 apr 2010

Emtacl10 Linked Data keynote


emtacl10:emerging technologies in academic libraries
Linking education data door Chris Clarke (Talis)
Talis was en is bibliotheek systeem in UK, ze hebben zich ontwikkeld richting semantisch web.
Chris heeft zijn keynote in 3 delen opgedeeld: 1) technische evolutie, 2 )linked data, 3) open on derwijs.
Ad 1) Technologische evolutie d.w.z. de ontwikkeling van Internet.
Hij laat het plaatje zien van Radar Networks, waarbij je een ontwikkeling kunt zien in stappen van 10 jaar, van PC naar Web 1, naar Web 2.0 en naar het Semantisch web en beyond. De overgang naar een nieuw millenium in het jaar 2000 betekende ook een omslagpunt voor de grote bibliotheeksystemen. Die zijn nu ‘done’ wat betreft innovatie. – In 1999 toen ik met X-ref begon had ik ook al zo’n gevoel te beginnen met iets dat eigenlijk al achterhaald was. Maar nu 10 jaar later ishet nog steeds levend – Ook Clark zegt dat die systemen nog steeds waardevol zijn, maar geen innovatieve betekenis meer hebben. De ontwikkeling van een ‘system of records” naar persoonlijke, interactieve systemen is dan al ingezet. We leven nu in een integratieve wereld, vol met mashups en api’s en metr werken in de cloud en met mobiele apparaten.
Ad 2) Er is ook een verschuiving merkbaar van documenten naar data. Van de geschiedenis van de hyperlink en WWW, naar ‘linked data” , “designe for appropiaton” ontwerp de data zodat het kan worden hergebruikt. En als eerste van die dag laat hij het plaatje van Dbpedia zien, dat de wolk van linked data weergeeft.
Op 11 december tijdens de bijeenkomst Advanced Services voor Researchers legde Frank van Harmelen het concept uit. Ik heb dat toen als volgt begrepen:

Abstracte informatie (geen link) maar graph, achter den URI (het webadres) staat informatie, meervormig over dat ding. Die graph kan overal info over het ding (voorbeeld over Frank) vandaan halen en dat presenteren.
Als datasets in RDF kunnen worden getoond dan kan dat in een meervormige 'graph' worden weergegeven dus geen eenduidige webpagina. Als alle dingen als RDF wordt aangeduid krijg je dus URI van dat ding. Vandaaruit verder clouden, zo kan computer doorschakelen naar een Web of Data, een Linked Open Data

Een mooi voorbeeld van linked data is Wild life Finder van BBC, die gebruik maakt van externe bronnen in zijn eigen site.
Nog wat voorbeelden zijn de Open data campagne in de UK om overheidsinformatie technisch toegankelijk temaken voor iedereen. Met mooie mashups in open data zoals die over waar gaat mijn belastinggeld naar toe.
Het belangrijkste probleem is de aanpassen van gedrag, technologie is niet het probleem. Het duurt zeker 5-10 jaar voor het mainstream wordt.
Ad 3) Open onderwijs. En van open data naar open onderwijs onder het motto: zoek, hergebruik en vermeng ( find, reuse, remix).
The Cape Town Open Education Declaration uit 2007 stelt dat onderwijs bronnen, -materialen vrij beschikbaar en gebruikbaar moeten zijn.
Voorbeelden daarvan zijn er wel zowel in Open Courseware als in initiatieven zoals peer-to-peer universiteit, waarbij vrijwilligers curssussen opzetten die voor iedereen te volgen zijn. Maar ook zijn er initiatieven met open textbooks al dan niet met Printing On Demand.
Clark: “The real disruption: changing policy, licenses, data ownership
Talis heeft een semantic web tijdschrift genaamd 'nodalities'
Presentatie

26 apr 2010

Emtacl10 Eerste track Research Support


emtacl10:emerging technologies in academic libraries
Na de pauze loopt het programma loopt in twee tracks uiteen: Research Support en Social Media. Ik kies voor Research Support.
Research disclosures in social media / Petter Bae Brandtzæg (SINTEF, Noorse org voor onderzoek)
Centrale vraag is: hoe maak je wetenschap aantrekkelijk voor een groot publiek die daar duidelijk ook belangstelling voor heeft ? Het gaat over de ‘democratisering; van de wetenschap.
Waarom zou je dat willen doen?
Vanwege de toenemende competitie bij fondsverwerving, van wege het maatschappelijk belang van wetenschappelijke ondekkingen en vanwege het feit dat wetenschappelijk onderzoek met publiek geld betaald wordt; dan heeft publiek ook recht te weten wat ermee gebeurt.
Maar ondanks dat de meerderheid van de mensen graag meer over wetenschappelijk onderzoek wil weten, blijven de onderzoekers in hun ivoren toren.
Brandtzaeg geeft positief voorbeeld van onderzoeker Joran Hurum, die zijn vonds over een ‘missing link’fossiel naast wetenschappelijk te publiceren ook breed liet uitmeten op een website en op radio en tv. Maar omdat dat niet voor iedereen is weggelegd is er wel een alternatief: sociale media.
“Social media is als teen sex”, ieder wil t maar niemand weet hoe
Waarom zou je als onderzoeker iet met sociale media willen doen:
- 70% van de internergebruikers gebruikt soc media
- Sociale media worden serieus
- Je hebt controle over je eigen boodschap
- Het delen is makkelijker vw digitale vorm en omdat het goedkoper is
- Het creeert open access movement
De voordelen van het gebruik van sociale media: zichtbaarheid, delen, nieuwe contacten, discussie, feedback
“Research disclosure is about sharing results: communicating, listening, sharing, accesibility”
Zijn presentatie is te vinden op Slideshare.
Ik vond het wel een aardige presentatie. Als voorbeeld noemde hij de twitterende wetenschappers op SciencePond.

Als bibliotheek kun je dan onderzoekers ondersteunen. Vraag is wel hoe?
Een collega raadde aan om eens te kijken nAar YouTube filmpjes van de Mayokliniek.

In het andere lokaal was een presentatie over Biptip, de reacties waren wel positief daarover. Nakijken dus!

Daarna volgde de presentatie : Taking the plunge: repositories and Research Pooling in Scotland // James Toon (University of Edinburgh)
Deze Schot zette het toch op een praten, wonderbaarlijk zo snel. Later hoorde ik van een andere Engelsman dat Schotten altijd al zo snel spreken. Helaas werd zijn woordenwaterval niet ondersteund door wat rustige dia’s. Hij had een presentatie gemaakt in Prezi, op zich wel aardig, maar met veel te veel tekst en veel te veel geflup. Vermoeiend dus.
In links gesproken ging het over de samenwerkende Schotse bibliotheken, onder meer samenwerkend in IRIS en in een data-library Edina.

EDINA is the JISC national academic data centre based at the University of Edinburgh*. Together with the University Data Library, it is a division of Information Services.

En dan komen we op een bekende pagina van de Data Library van de Univ Edingburgh, met o.m. een bruikbare guidelines pagina en de mogelijkheid tot uploaden van datasets en zoeken in datasets.

Zijn eigenlijke thema was het Eris project
The ERIS Project (Enhancing repository infrastructure in Scotland) has unfortunately generate a mixed definition of repositories

En in Europese projecen over CRIS en het standaardformaat CERIF steekt hij ook zijn interesse.
Using CRIS (Current Research Information Systems), which bring together the information that underpins this research, we can avoid the risk of losing out on significant improvements in wealth and quality of life.

CERIF (Common European Research Information Format) is the glue that holds the information systems together, allowing for interoperability.

Zijn conclusie was “Research pooling is a good thing”. Tijdens de receptie vanavond heb ik nog geprobeerd met hem te praten. Ik begreep dat het om samenwerkingsverbanden ging, waarbij een aantal universiteiten dwarsverbanden aangaan op een onderzoeksonderwerp. Maar helaas bleek hij ook in een persoonlijk gesprek te snel van tongriem. Blijft niets anders over dan zijn presentatie te lezen als die bekend is. [volgt nog]

Vervolgens is het woord aan Jennifer Kniesch (Dickinson College)
WorldCatImage: a new authoritative image location database aggregator
Ze leest het voor van een briefje. Idee voor aggregator in het zoeken naar afbeelding. Uiteindelijk blijkt het wel een leuk idee, waarvoor ze een demonstrator heeft gebouwd op basis van Camio.

Dat was wel weer genoeg voor vandaag. Ben nog even in de wandelgangen gaan zitten. Erg comfortabel is dit hotel. Elektriciteit en draadloos internet is geregeld, alsmede voldoende koffie en zelfs nog broodjes in de pauze van vier uur.
Naar orgelconcert in de mooie Nidaroskathedraal. Een kerk met twee orgels: een barokorgel, wat erg mooi klonk en een zwaarder moderner orgel, wat niet zo mooi klonk. Maar toen de laatste klanken uitstierven verhelderde de ondergaande zon het glas-in-lood-raam op een fascinerende manier. Erg mooi. Na het concert naar het universiteitsgebouw gelopen. De Universitiet bestaat dit jaar precies 100 jaar en we kregen een receptie met champagne en hapjes in de raadzaal.

Emtacl10 Opening


emtacl10:emerging technologies in academic libraries, 26 – 28 April 2010 • Rica Nidelven Hotel • Trondheim • Norway georganiseerd door NTNU(NORGES TEKNISK-NATURVITENSKAPELIGE UNIVERSITET).

We zijn al anderhalve dag in Trondheim, dus al aardig geacclimatiseerd. Het is lekker weer, in de zon kun je op een terrasje zitten, maar er blijft een ‘pool’windje waaien. De sneeuw is net weg, gras is bruin en alleen af en toe zie je wat klein hoefblad bloeien.
We beginnen met een uitgebreide lunch. Daarna opent de rector van de NTNU de conferentie. De wetenschappelijke bibliotheken hebben de overgang van traditioneel naar digitaal gemaakt, en nu de vervolgstap. Toepassen van nieuwe technologie is essentieel voor toekomstig onderwijs.Hoe gedragen zich onderzoeker en studenten, dat is cruciaal voor positie van bibliotheken. Bibliotheek is niet vanzelfsprekend in beeld van student.
Dan volgt de keynote van Lorcan Dempsey van OCLC over netwerken. Helaas werd hij onderbroken door een – vals – brandalarm.
The network has reconfigured whole industries. What will it do to academic libraries? Lorcan Dempsey (OCLC) voorheen JISC. Dempsey begint met en later komt er nog vaker op terug een voorbeeld Netflix. Dat is een Amerikaanse site om filmpjes te kijken, die buiten US niet werkt. Hij draait er nogal lang omheen en het dreigt even saai te worden totdat hij me weer helemaal bij de les brengt met prachtige woorden als ‘referencability’ ‘distinctive impact’, die moet passen in ‘research & learning environment’, met zijn ‘collections grid’ die de ‘stewardship’ in beeld brengt, waarbij uniciteit en schaarste een rol spelen. “Outside in en inside out” spoort hij de bibliotheken aan.

'Scalability of access': iedereen kan overal makkelijker bij.
Ik ben het eens met Dempsey dat dat de positie van bibliotheken tekent. De wereld zit op het netwerkniveau, terwijl de bibliotheken op institutionele schaal georganiseerd zijn.
- 'Discovery happens somewhere else' zorg dus behalve voor directe, voor indirecte lijnen, disclosure & syndication. En uiteraard 'serendipity', hij doelt daarbij op suggesties, het ‘managen van demand’.
- Reputation management = profielen zijn overal, de bibliotheek zou een rol kunnen nemen m.b.t. standaardisering van schrijfwijze van naam. ‘Je eigen profiel is de eerste pagina als je jezelf zoekt in Google’, parafraseert hij een uitspraak.
- Citation Management: bibliografische software. Veel bibliotheken adviseren voor een programma, maar je zou moeten aansluiten bij de context en de community van de onderzoeker en de meerwaarde zoeken.
- Social thing: we gaan weg van collecties:Content was king now much. Nu kun je veel makkelijker aan alles ‘stuff’komen.
Boek: The Power of Pull: How Small Moves, Smartly Made, Can Set Big Things in Motion
De kerncomponenten van een organisatie zijn infrastructure (eenvoudiger systemen), customer relation management (ruimte voor rendez vouz en showcase) en product innovation (expertise aanwenden voor tools).
Nakijken de resources bij Center for digital research and scholarship
Dempsey’s boodschap is duidelijk: laar institutionele, locale los en omarm het netwerk en zet je expertise in voor tools en toepassingen i.p.v. voor collecties.

21 apr 2010

Spui25 lezing e-boek

Op donderdag 15 april organiseerde Spui24, academisch-cultureel centrum van de UvA, een avond onder de titel “NU! Het e-boek: gevaar of uitdaging?”

Wat zijn de gevolgen van de toenemende populariteit van het e-boek voor uitgevers, schrijvers, onderzoekers en recensenten? Zijn deze gevolgen al merkbaar of kunnen we alleen nog maar naar de consequenties? Slaat het e-boek echt aan of is het niets anders dan een goed geregisseerde hype?



Het leek mij een interessant thema, en ik was ook benieuwd wat een deskundig panel daarvan zou zeggen. Voor onze bibliotheek heb ik onmiddellijk na de lancering in 2007 een tweetal e-readers gekocht, en recentelijk weer eens twee van de nieuwe generatie. Ook schaffen we al een aanzienlijke hoeveelheid e-boeken aan in de vorm van online digitale boeken. Over de readers en de online boeken heb ik eerder bericht.

Meerdere mensen dachten dat het een goed thema was, want de zaal bleek bijna geheel gevuld.
Het was dan ook een teleurstelling toen al snel bleek dat slechts 1 persoon (Hans Vervoort, de schrijver) van het panel langer dan een paar minuten ervaring had met een e-reader. Mizzi van der Pluijm, de uitgever had wel ervaring met het uitgeven van e-boeken, maar of ze ooit een e-reader heeft gebruikt bleek niet. Overigens werd haar betoog een dag later gepubliceerd in de NRC. "e-book: gadget voor 50+" . Een tweede probleem met dit thema is dat overal ereader - het apparaat - en e-boek – het elektronisch boek, dat je desgewenst op een apparaat kunt laden - door elkaar gehaald worden.

Paul Dijstelberge, docent, viel wat mij betreft al meteen door de mand toen hij de Ipad, die hij zojuist ter hand gekregen had, prees omdat hij er zo fijn een woord mee kon opzoeken in een woordenboek. Uitgerekend een feature die de allereerste e-reader in 2007 ook al kon. Hij vind e-readers onzindingen. (Tja, wat de boer niet kent....)

Carel Peeters, de criticus, heeft geen e-reader en wil er ook geen. (Tsja, wat doe je dan hier...).
En Liza Kuitert, de professor, liet er zich verder, wijselijk, niet over uit.

Hans Vervoort, de enige dus met e-reader ervaring bracht wel een interessant punt naar voren. Hij betoogde dat veel schrijvers in de problemen komen omdat een uitgever snel succes wil scoren, met een grote stapel bestsellers en zodra het nieuwe eraf is lig je al bij de tweedehands zaak. E-boeken kunnen in zijn visie de long tail zijn van de boekhandel, oude schrijvers en vergeten, dan wel niet meer verkrijgbare boeken van huidige schrijvers kunnen makkelijk geleverd worden. Als schrijver ben je niet meer afhankelijk van de drang naar snelle winst van de uitgever. Ook amateurs kunnen makkelijk publiceren m.b.v. Publishing on Demand. Maar, vroeg de uitgever, als iedere amateur zelf publiceert krijg je zoveel op de markt wie zorgt er dan voor dat de kwaliteit naar boven komt – zij vindt dat een rol van de uitgever.

In de wetenschappelijke wereld eigenen de uitgevers zich die rol toe, die van de kwaliteitscontrole = peer review op de wetenschappelijke publicatie, althans de organisatie daarvan (de controle zelf wordt uitgevoerd door wetenschappers). Dat zette me wel aan het denken over de vorm van fictie. In tegenstelling tot wetenschappelijk publicaties kan ik bij fictie niet zo veel vernieuwende uitgavevormen bedenken. Een wetenschappelijk artikel kun je publiceren als een verzameling losse concepten bijvoorbeeld, zonder de noodzakelijk structuur van een conventioneel artikel. Maar kun je een roman anders vormgeven dan een doorlopend samenstelling van zinnen. Daar gaat het nu juist over. Hmm dat is nog eens een heel ander probleem. Las overigens wel dat er nu ook korte verhalen voor de iPhone beschikbaar komen (Nature artikelen voor Iphone zijn er al), dus als de uitgevers echt meewerken en van het pdf-formaat afstappen, zit er nog toekomst. Gelukkig noemde v.d.Pluijm dat ook als struikelblok.

Enfin, de discussie kabbelde voort, waarbij vooral negatief gedaan werd over de e-reader, en over de noodzaak om de rol van de uitgever rustig te definieren. Leuke voorstellen uit de zaal als: automatisch bookmarken en dan in een keer alle gebookmarkte stukken uit je tekst trekken als een samenvatting en combinatie met multimedia zorgden er in ieder geval voor dat mijn vertrouwen niet helemaal werd beschaamd.

8 apr 2010

4e Onderzoeksdataforum


Woensdag 7 april 2010 de 4e bijeenkomst van het Onderzoeksdataforum.
De animo loopt duidelijk wat terug, er zijn minder mensen en uit de korte verslagen van de werkgroepleiders blijkt dat er – zeker m.b.t. uitvoering – weinig menskracht beschikbaar is.

3 TU kondigt een workshop aan “Digital Curation: training & workshop” op 23 april in Delft

Surf heeft op 28 april een rondetafel bijeenkomst met beleidsmensen van Surf over datamanagement beleid: er is een checklist in opzet.

De middag begint met de presentatie van Titia van der Werf van de IISG van de “IISH Guidelines for preserving research data: a framework for preserving collaborative data collections for future research” SURFshare programme 2007-2010, WP7 Datacuratie en digitale duurzaamheid

Ze legt uit aan de hand van de context-beschrijving van hoe het IISG in elkaar zit hoe de richtlijnen tot stand gekomen zijn. Uitgaande van de individuele onderzoeker, die een dataverzameling opbouwt en ook een relatie met het documentatiecentrum heeft. Die later ook zijn dataverzameling aan het centrum ter beschikking stelt voor hergebruik. Kenmerkende elementen hieruit zijn: behoeften van onderzoekers: extraheren van gegevens uit dataverzamelingen, collaboratories, bewaarplaatsen.
Collaboratories en bewaarplaatsen groeien naar elkaar toe in behoefte aan gedeelde onderzoeksfaciliteit: dynamische dataset, groter en internationaler, structurele kosten
Er zijn aardig wat collaboratories en data hubs bij IISG.
Vanuit bronnen maak je gegevensverzameling, dat is laag 0, daaruit maak je een brongetrouwe dataset in laag 1, daar zit wel metadata bij, maar is nog niet geschoond.
In laag 2 schoon je de data, ontdubbel en anonimiseer je die. In laag 3 kun je dan analyseren en de gegevens bewerken.
De richtlijnen zijn gebaseerd op DDI v2, maar bijv. voor versiebeheer is v3 nodig. De richtlijnen zijn vrnl theoretisch kader.

Vervolgenss geeft Gera Pronk van Surf een introductie in E-IRG (e-infrastructure reflection Group) Data Management Task Force report. Als ik goed geteld heb worden er in e-IRG DTMF report 62 programma's genoemd, allemaal met eigen acroniem. Geeft overzicht EU initiatieven. Het rapport geeft uiteindelijk 21 aanbevelingen, waarvan een flink aantal in de categorie ‘open deur’.

Een aantal ook gaan over terminologie, semantisch web, linked data en dat brengt de discussie op ISO 11179, dat een definitie geeft over terminologie voor metadata. En zo komen we op Isocat. Er is ook een website over ISO TC 37 Terminology.

Naar aanleiding van dit E-ISG rapport heeft Wilma Mossink 5 stellingen opgeschreven waaraan alle deelnemers via dotmocracy methode kunnen aangeven wat ze er van vinden:
- Rol Surf: vertaalslag buitenlandse initiatieven – verschil in financiering (geen subsidie als de data niet gedeponeerd is)
- Rol Surf: guidelines voor uitwisseling – faciliteert
- Metadata: flexibele standaard
- Hergebruik: ieder onderzoek specifiek
- Opslag: cloud computing
- Kwaliteit: data repository kan weigeren
In groepjes bediscussiëren wij de aanbevelingen. Bij de eindbespreking blijken de meningen nogal uiteen te lopen. Iedereen is er wel over eens dat de aanbevelingen van de E-IRG niet rijp zijn om zomaar breed verspreid en besproken te worden. Daarvoor zijn ze toch te onduidelijk en te controversieel. Vraag is natuurlijk ook of er disciplineoverstijgende aanbevelingen te maken zijn. Wellicht is daarvoor het onderzoek toch te specifiek. En m.i. is het ook lastig om over de beperkingen van de huidige situatie op organisatorisch en technologisch vlak in de toekomst te kijken. Kwaliteit is wel een issue. Ook de kwaliteit van metadata, maar wie beslist uiteindelijk wat slechte kwaliteit is. Wel is het nodig om kwalitetiscriteria ontwikkelen.

Gera gaat een white paper schrijven over data management. Ook vanuit Knowledge Exchange zal een white paper worden geschreven, en zelfs vanuit ons werkgroepje gaan we een white paper schrijven.
White paper: de oplossing voor alle problemen??

In wikipedia: Een witboek of white paper is een technisch document dat beschrijft hoe overheidsbeleid, een technologie, en/of product een specifiek probleem oplost. Witboeken worden gebruikt om de lezer van objectieve relevante informatie te voorzien die wordt gebruikt voor het nemen van een beslissing]

3e OnderzoeksdataForum

Op 15 oktober 2009 is de 3e bijeenkomst van het Onderzoeksdataforum geweest. Tot mijn spijt zie ik dat ik er geen blogje aan gewijd heb. Dat is jammer want ik was er wel. Dan maar even achteraf: in tweets:

* Vanmiddag Onderzoeksdataforum bij Surf. Bespreken we de Terms of Reference van de werkgroepen, en pubs van 3TUD en Cier en ook nog een casus",15 October 2009
* Maar eerst met de OV-fiets naar station Breukelen. tis prachtig weer, bomen langs de Rijksweg verkleuren al mooi",15 October 2009
* Presentatie van A Ringalda van cier over eigendomsrecht van databanken #onfor",15 October 2009
* Onderzoekers met n dienstverband hebben strikt genomen zelf geen auteursrecht en overdragen daarvan betekent dus niets",15 October 2009
* Rapport Cier Juridische Status van ruwe data ",15 October 2009
* Jeroen Rombouts van 3TU over project Waardevolle data & diensten: motiveren datapublicatie ",15 October 2009
* Dotmocracy.org gebruik bij workshops bespreking stellingen onderzoeksdata",15 October 2009
* Interessant onderzoek van 3tu Op hun site ook fraaie voorbeelden",15 October 2009
* Na de thee gaan we casus doen: beheer resultaten onderzoeken",15 October 2009

Hier hield de tweet flow op. In mijn aantekeningen lees ik dat we twee casussen hebben besproken: een van NIOZ in het kader van het International Polar Year (IPY). NIOZ verzamelt de data die Nederlandse onderzoekers hebben geproduceerd in het kader van het IPY project. Het gaat daarbij om het veiligstellen van data, ruwe data, format, backups (mirroring verschillende IPY-datacentra) via de Global Change Master Directory (online) en een IPY Metadataprofiel ‘DIF’
Hij vult als datamanager alvast velden in die hij kent van zo’n dataset en begeleid dan de individuele onderzoekers bij invullen. Data publiceren achter link van de metadata.: interface met GCMD portal.
Een Tweede casus kwam van de U Tilburg en draaide om het opstellen van een datamanagementplan.
De vragen die daarbij spelen gaan over: vocabulaire / formaten / gebruikers / privacy / interdisciplinaire datakwaliteit / duplicering vermijderen / bronnen / normaliseren /methodieken /
*
Aansluitend aan deze bijeenkomst van het DatanderzoeksdataForum hebben we als werkgroep Deskundigheidsbevordering een werkgroepbijeenkomst gehad op 15 december 2009. Daarbij zijn we uiteindelijk tot een Terms of Reference gekomen. Ik heb een wiki opgezet in PBWORKS, omdat ik in de Surfshare Surfgroepen site geen bevoegdheden heb/had om iets toe te voegen. De wiki heb ik genoemd: nldatamanagement.pbworks.nl en heb ik alleen op aanvraag toegankelijk gemaakt.

Achteraf opgemaakt, na de 4e bijeenkomst.