15 sep 2016

tpdl2016 - Reproducible Open Science

Na het TPDL2016 congres was er nog een eendagse workshop 'Reproducible Open Science' RepScience 2016. De presentaties zijn op de website te lezen.

De introductie was meteen al geweldig: "What is Reproducibility? The R* brouhaha (and how Research Objects can help", want Carol Globe legde helder uiteen wat Reproducibility is en wat voor problemen eraan vast zitten. Het begint al bij het woordbegrip, en daarna volgen er nog stappen in elke fase van het onderzoeksproces om tot meer reproducibility te komen Daarna werden er voorbeelden gegeven van diverse pogingen om de voorwaarden om onderzoeksdata herhaalbaar, beter herhaalbaar te maken, te verbeteren. 
Van het opzetten van strikte standaarden tot een poging tot het maken van een automatische rerun applicatie.
Erg boeiend onderzoek en zeker ook het lezen waard.

De tweede keynote-spreker, en tevens de enige die sprak over daadwerkelijke pogingen, was Sunje Dallmeier van CERN. In eerdere stappen was er al sprake van het linken van data aan de publicatie. 
[ Dat was overigens ook het onderwerp van een tutorial bij TPDL2013 - From preserving data to preserving research - waar ik voor het eerst over researchobjects hoorde, dit gaat daar aardig op verder]. 
Dus je archiveert niet alleen de data, maar ook de workflow en eigenlijk alle bronnen die van belang zijn bij het onderzoeksproces. 
Sunje Dallmeier beschreef hoe ze werkte om van de huidige versnipperde manier met open data, publicatie - en data repository tot één geheel te komen


Ze geeft ook aan dat e.e.a. niet erg gemakkelijk nog is voor de hardwerkende CERN-onderzoekers, die zich door nog meer - bureaucratische - regels moeten worstelen alvorens hun onderzoek te kunnen afronden.
Hopelijk gaan de overige onderzoekers van de workshop verder met hun onderzoek naar het makkelijker maken en betere voorwaarden scheppen voor reproductie van wetenschappelijk onderzoek. Van voorwaarden vooraf tot beloning voor replicatie-onderzoek.

Een aantal projecten gaat al iets verder met het integreren van de verschillende gegevens: onder meer het project THOR: technical and human infrastructure for open research, dat probeert Persistent Identifiers te integreren en werkt bijv. met Data Cite en ORCID.
Een ander project is het Scholix project dat probeert een platform te zijn voor link exchange, en dan met nae voor wat betreft de links tussen literatuur en data.

TPDL 2016-1 computational blending design

Overcoming the Limits of Digital Archives" het thema van de 2016 editie van TPDL, theory and Practice of digital Libraries, deed me denken aan het thema van een workshop die ik in 2014 gevolgd heb ter gelegenheid van het verblijf van 2 fellows (Treloar en Van Sompel) bij Dans “ het wetenschappelijke archief van de toekomst".
We zijn nu 2 jaar later, maar zijn we ook al opgeschoten? De centrale vraag van die workshop was een roep om sturing en coördinatie in RDM. en inmiddels hebben we het Landelijk Coördinatiepunt RDM, dat is alvast iets en iedereen spreekt over big data en open toegang tot data ivm bijv. Textmining.
Dat was 3 jaar geleden op TPDL 2013 niet anders, maar deze tpdl’ers zijn geen gebruikers, maar onderzoekers,  dus benieuwd naar hun relaas nu hier in Hannover.

Het is de 20ste TPDL;  20 jaar geleden was ‘ digital libraries’ hot, in USA en in 1994 initieerde NSF een 'Digital Libraries'initiative  dat leidde tot Google initiatief.
In Europa begon de computervereniging Ercim  met de European Conference on Digital Libraries (Ecdl). Sinds 2011 heet het  TPDL en in 2017 wordt de bijeenkomst gehouden in Thessalonica.

"Overcoming the limits of digital archives" kun je ook begrijpen als een samengaan van de verschillende typen archiven met andere typen van bewerking. Of om een veelgebruikte benaming te gebruiken, er is sprake van 'blended computational design'
Dus verzamelingen (digital libraries) van verschillende soorten (tekst, beeld, video, muziek, data) samenbrengen en gelijkwaardig kunnen bewerken, archiveren en terugvinden.

Samengevat in een woordenwolk:

De keynote van David Bainbridge over zijn 'Greenstone Digital Library'-project, waarbij hij probeert om muziek en tekst te 'blenden' en ze een eigen verhaal te laten vertellen. Hij wist dit heel aardig te verwoorden in een verhaal dat ging over Mozart in de tegenwoordige tijd.
Waarbij, met gebruikmaking van de software Expeditee van Rob Akscyn, hij al een aardig eind op streek raakte met het samenvoegen en snel bewerken en toevoegen van muziek en tekst.
″If Aphrodite is the Goddess of Love, then let Expeditee be the Goddess of Getting Things Done!″—Rob Akscyn: Inventor of Expeditee, maar in Greenstone gaat Bainbridge verder nog met talk back opties, oversturen van bestanden, integreren van video e.d.

Tony Veale liet in zijn presentatie over Computation Creativity zien wat er allemaal niet mogelijk als je op basis van karakter analyses gegevensverzamelingen en gebruikmaking van kunstmatige intelligentie.Om een goed verhaal te kunnen vertellen heb je ook goede ingrediënten nodig en de manier om de digital libraries die je hebt op een betekenisvolle manier aan elkaar te knopen. Zijn groep gebruikt daar Twitterbots voor, die zelfs pogen humor, ironie te produceren. Lees zijn Best of Bot Worlds. 


Klaar is het wetenschappelijk archief van de toekomst nog lang niet, maar er zijn wel stappen voorwaarts en in de breedte gemaakt.

De proceedings van tpdl2016 zijn nog tot 26 gratis te downloaden: http://www.tpdl2016.org/proceedings. Daarna als Springer ebook.

10 sep 2016

TPDL 2016 - Gastheer TIB, Hannover

Hannover is een aardige stad. Het station, waar ik aankwam is overweldigend: groot, druk, heel veel winkels op twee lagen. Verder is de stad erg groen, met stadsparken, een stadsbos en zelfs een compleet meer in de stad (op de foto overigens de vijver bij het conferentiecentrum) . Mijn hotelkamer is op de 11e verdieping en dat geeft een aardig overzicht over de stad. 

Hannover is de stad van Leibniz: Gottfied Wilhelm Leibniz, filosoof en allround geleerde, die 400 jaar geleden stierf. – Bekend van de uitvinding van de eerste rekenmachine en de differentiaalberekeningen. Zijn beeltenis en naam zijn alom tegenwoordig. Interessant ook zijn beeltenis en uitspraak (zeker met het oog op de huidige politiek immigrantengerelateerde verkiezingen) : Éinheid in der Vielheit: unitas in multitudine”


Ook het openbaar vervoer is goed geregeld met bussen en trams. Het enige probleem dat ik had is met station Kröpcke, dat is zo groot met drie verdiepingen en een kruising van alle metrolijnen dat ik telkens verkeerd liep.

De conferentie begon al goed met een rondleiding in de TIB de Duitse nationale bibliotheek voor wetenschap en techniek, althans ze zijn de nationale bibliotheek op een aantal vakgebieden zoals architectuur, wiskunde en engineering. en nationaal wil dan zeggen Duits, federaal nationaal en niet alleen van de landsregering Niedersachsen - dat is de bibliotheek rond G.W.Leibnitz wel, die is meer regionaal.
De TIB is dus een nationale bibliotheek en streeft naar een volledige dekking van hun vakgebied, daarnaast doen ze ook dienst als een 'gewone'universiteitsbibliotheek voor de Leibniz-universiteit Hannover .  

TIB is ook de gastheer van deze conferentie. Naast een omvangrijke en technische nationale collectie hebben ze ook een groot AV-portal, waarin ze o.m. ook video’s hosten van Copernicus tijdschriften o.m. van het tijdschrift Soil.

TIB heeft een afdeling Research and Development. Een indrukwekkende bibliotheek.Dit begon al goed met een portie Duits-politieke verwarring, maar werd later nog eens bevstigd in een panel waarbij gesproken werd over het beleid van de DFG (Deutsche Forschungs Gemeinschaft) om de subsidies voor de zwaartepuntbibliotheken te vervangen door een flexibele subsidie naar Fach Informations Diensten, innovatieve diensten op een bepaald vakgebied. De discussie ging om het financieren van langetermijn content vs innovatieve tools, over onderwerpsgericht bibliotheekbeleid vs vragen van onderzoekers en om samenwerking tussen die twee.
TIB zit daar ook tussen, wordt deels gefinancierd door centrale overheid en deels door de diverse deelstaten.  Is collectie-financiering wel een taak van een onderzoeksfinancier? Moet die niet veel eer het belang van de huidige onderzoeker dienen door moderne onderzoeksmethoden, in samenwerking met bibliotheken te realiseren. Probleem in Duitsland is dat er dan geen overkoepelend instituut is dat collecties, cultureel erfgoed beheerd, kan financieren.

Panel 2 ging over de vraag wat het maatschappelijk belang van bibliotheken is.
Overal worden op grote schaal bibliotheken gesloten, juist weer omdat die fianciering niet helder is. Het publiek en de politici hebben vaak een romantisch idee van bibliotheken, maar nauwelijks de harde centen over voor de instandhouding van cultureel erfenis en kennis, maar ook de selectie digitale objecten, de wegwijsfunctie in de vergaarde kennis en de open ruimte en mogelijkheden die kennis tot je te nemen. Dat mag, aldus een van de deelnemers, je niet overlaten aan de commercie..


5 sep 2016

De toekomst van het vak

Op de laatste dag van augustus 2016, een zeer warme dag, naar een 'kennis-update'middag geweest van KEI-IP.
KEI-IP is een stichting die poogt een certificeringsregister op te richten voor informatie-professionals om vakbekwaamheid en imago te bewaken.

De eerste bijeenkomst was een 'ronde-tafel-conferentie' op 25 januari 2015 in Amsterdam.
Daar werd wel duidelijk dat certificeren en imago-behoud voor informatieprofessionals nog niet zo eenvoudig is. Zeker niet in het kader van de opleidingen. [Het zijn perslot de bibliotheek- en documentatieopleidingen zelf die het imago en beroepsbeeld van de bibliothecaris afgebroken hebben.].

Enfin, ik ging erheen omdat ik wel achter het idee van een certificering en imago-bewaking sta (mijn idee was dat dat een opgave is van met name de beroepsvereniging, maar helaas heb ik daar nooit een poot voor  aan de grond gekregen en de NVB wist ook niet hoe gauw ze hun naam – en imago- moesten ruilen voor zo iets onduidelijks als KNVI) .
Tijdens mijn masteropleiding aan de UvA heb ik eens een werkstuk gemaakt over de ‘toekomst van de informatieprofessional’ gebaseerd op een onderzoekje in personeelsadvertenties in het vakblad (destijds Open, nu IP). Dat was in 1999. Ik heb daar zelfs een presentatie van gemaakt.
In 2007 heb ik al eens een ‘track’gevolgd bij eenNVB-congres getiteld Het VAK: 
En in 2012 heb ik eens geopperd een Register Bibliothecarisop te richten, n.a.v. de roep om meer ‘agile’ vakgenoten.

Maar de materie is tamelijk weerbarstig. Ook de eerste bijeenkomst van de KEI-IP stichting  was een poging om althans een inventarisatie te maken, maar erg ver kwamen ze nog niet.
Dus nu anderhalf jaar later een update en wel in Den Bosch. 

Het register is er nog niet, maar er wordt hard aan gewerkt.
Een aantal opleidingen, met name part time opleidingen (de full time opleidingen bda, later idm zijn immers al lang weggewerkt) werkt mee, zoals GO-opleidingen, VHIC, Docis-DIOR, Becis en de full time opleidingen Media, Informatie en Communicaite in Amsterdam, en ook in Den Haag is de idm onder een andere naam nog actief (onder welke naam weet ik niet meer).

Heel aarig was de introductiefilm die Frank Hendriks gemaakt had, waarin hij een aantal voorzitters van beroepsverenigingen interviewt. Een drietal had positief gereageerd en wildeook een mening geven over het cerificeren: Wesseling (KNVI): is hulpmiddel, Fluyt (NVBA) is noodzakelijk vw kwaliteitskeur, Keijspers (BRAIN) is niet nodig, want selecteer zelf in sollicitaties nauwkeurig.
De film en ook de rest van de voordrachten wordt nog openbaar gemaakt.

Vervolgens heb ik een aantal alleraardigste presentaties bijgewoond, bijv. die van Gertjab van Heist over Big data, over de trends en wat het voor ons vak (en dus de opleiders) betekent.
De trends opgedeeld in clusters:

-       production in dienstenvorm (saas)
-       Internet of things (smart)
-       Data capitiliseren (bi, warehouse )
-       E-life (leven online)
Technologies die mogelijkmaken: big data, connectedness, artificial intelligence (zelflerend)
 De centrale vraag is : hoe zorg je dat mn goede data verbonden wordt : door databeveiliging
De data- industrie, dat is data veredeling  : 4 groepen grote spelers die dat spel spelen
: data beheer, software, dataleverantie, gratis diensten
Additionele diensten ontstaan  tussen grote spelers en de markt; en grote spelers geven daar ruimte voor(add on).
Verantwoordelijkheid ip'er  blijft zelfde = essentie, Wat verandert zijn de middelen, de vorm.
IP wordt meer inkoopmanager,  en er is een grote rol van standaarden, meer coordinatiepunt.

Vervolgens spreekt Erik Kokke over 'informatieheld', ip'er als houder voor information overload en filter failure. Wel aardig is zijn gebruik van mentimeter waarmee we kunnen antwoorden met smartphone en de antwoorden terugzien in een woordenwolk.  
"Toegevoegde waarde is niet wat je doet, maar het resultaat: bijv.  excellente beoordeling instituut.".


En als uitgeleide van de middag kwam Peter Noorhoek met een keynote over brachekwaliteit van beroepsorganisaties. Aardig is zijn vergelijking van "de bibliothecaris" met "de notaris"; resp. vroeger hoog resp. laag gewaardeerd, zonder toezicht resp. met toezichthouder en nu in status gestegen. 

Toch weer een leerzame middag! 
De lezingen en informatie worden door Kei-ip nog bekend gemaakt.