29 sep 2011

CWTS-cursus meten van wetenschappelijke output 1

Op maandag 26 september 2011 komen in een veel te klein zaaltje in het Willem Einthoven-gebouw van de Universiteit Leiden, 20 studenten samen voor de cursus “Measuring Science and Research Performance” van het CWTS. Het CWTS is de afdeling van de Universiteit Leiden die door bibliometrisch onderzoek wetenschaps- en technologie indicatoren berekent en de onderzoeksresultaten van een universiteit of afdeling bibliometrisch onderzoekt. CWTS heeft daarin wereldwijd een grote naam opgebouwd. De studenten komen dan ook uit 9 verschillende landen


De eerste dag heeft een inleidend thema:’de wereld van de wetenschap, technologie en innovatie’.
Paul Wouters, directeur van het CWTS, opent met een eerste inleiding over het vakgebied van de ‘scientometrics’.
Beginnend met het filmpje “Science is real”. Dat aangeeft waar het bij wetenschap om gaat, om de content. Voor scientometrische beschouwingen worden citaties uit die werkelijkheid van de content gehaald en als zelfstandige entiteiten behandeld (verzameld en geteld).

Terwijl in de cirkel van onderzoek het debat, de peerreview, de interactie met collega’s centraal staat, heeft de cirkel van de citaties een eigen focus van aantallen. Paul schildert de opkomst van citatietellingen, vanaf 1873.
Paul Wouters, zelf gepromoveerd op “The Citation Culture”wat de geschiendenis van de Science Citation Index beschrijft, schildert de opkomst van citatietellingen, vanaf 1873.
Hij concludeert bij de opmerking dat Garfield al in 1955 bij zijn eerste idee van een citatie index, veel afwijzende reacties kreeg, dat in wezen de kritiek nog steeds dezelfde is “een citatie zegt niets over de publicatie zelf’.
Zie ook de beschrijving van de citation index in Wikipedia

R!=C reference is the inverse of the citation


Een citatie gebruiken als indicator voor een publicatie is geen natuurlijk proces, het komt niet voort uit de wetenchapo zelf. Een citatie is veel meer een teken van erkenning in de reputatie-competitie.
Een basisvraag blijft dan ook ‘waarom wordt een werk geciteerd’? Dat citatie-gedrag is tamelijk lastig omdat het geen wetmatigheid betreft maar een psychologisch, sociologisch en cultureel bepaald proces is. De huidige dominante theorie is de normatieve theorie, gebaseerd op de ideeen van Kaplan, N. The norms of citation behavior: Prolegomena to the footnote. American Documentation 16, 179-184, doi:10.1002/asi.5090160305 (1965).
Ton van Raan vervolgt, als nestor van de club, met een uiteenzetting over de ‘basics’van de bibliometrie:
1. Netwerken: primair citatie netwerk, co-citatie netwerk, bibographic coupling
2. Kennisvelden, breng de wereld in kaart m.b.v. door citaties gerelateerde word countings n een driehoek
3. Genormaliseerden onderwerpsvelden , en naar tijd genormaliseerde citatievensters
Bibliometrisch onderzoek kun je top down benaderen, gebaseerd op veld structuren, of bottom up, waarbij de auteur de gegevens kan inbrengen.
Belangrijkste indicatoren zijn: P (publicaties), C+sc (citaties), CPP (citaties per publicatie), Pnc (publication not cited = time depended)en top 10%.
De zogenoemde ‘crown indicator’is de CPP/FCSm (dus de citaties per publicatie gedeeld door gemiddeld aantal citaties per veld) Dat boven 1 moet zijn.
[Tegenwoordig hanteren ze de MNCS mean normalized citation score, waarbij ook het gemiddelde van het tijdschrift wordt meegeteld].
Wat kun je met bibliometrics?
* Invloeden meten van wetenschappelijk werk
* Patronen ontdekken in de structuur van de wetenschap.
Tegenwoordig wordt meestal de term 'scientometrics' gebruikt, om aan te geven dat er bij evaluaties naar meer wordt gekeken dan alleen naar citaties van publicaties. Scientometrics is ook de term voor organisaties rondom dit thema. Zo is er een European Summer School of Scientometrics, die van 11-16 september gehouden werd, en die vlgs een Zweedse mede-cursisten al helemaal was volgeboekt. De presentaties zijn op de website gepubliceerd en omvatten dezelfde thema's als in de CWTS-cursus: citaties, indicatoren, science mapping. Ook is er een International Society for Scientometrics and Informatics, die in juli 2011 heeft gecongresseerd in Durban, Zuidafrika. ieder 2 jaar wordt door ISSI een congres georganiseerd, en meestal in het tussenliggende jaar organiseert CWTS een 'Conference on Science and Technology indicators'. Er bestaat een tijdschrift gewijd aan de onderwerpen die in dit vakgebied een rol spelen getiteld Scientometrics, en een ander belangrijk tijdschrift is JASIST, Journal of the American Society for Information Science and Technology.

18 aug 2011

Trends Academische Bibliotheken

ls aanvulling op mijn eerder berichtje over de toekomst van de academische bibliotheek hier een kort overzicht van een nieuwsbericht uit College & research Libraties news.
"2010 top ten trends in academic libraries: A review of the current literature" by ACRL Research Planning and Review Committee

1) Academic library collection growth is driven by patron demand and will include new resource types.
Collectievorming gaat van 'justincase'naar 'justintime'. gebruik maken van patron-driven acquisition formaten. Locaal materiaal wordt gedigitaliseerd en toegang tot ful text en tot datasets wordt gemeengoed.
2) Budget challenges will continue and libraries will evolve as a result
Door budget reducties wordt het moeilijker adequaat personeel aan te trekken,toegang tot bronnen te verwerken en innovaties door te voeren.
3) Changes in higher education will require that librarians possess diverse skill sets
Bibliotheekpersoneel moet voortdurend bijgeschoold worden. ook zullen meer niet-bibliotheekgeschoolde medewerkers in het vak intreden
4) Demands for accountability and assessment will increase.
Aan bibliotheken wordt gevraagd de toegevoegde waarde van hun diensten aan te tonen.
5) Digitization of unique library collections will increase and require a larger share of resources
6) Explosive growth of mobile devices and applications will drive new services.
7) Increased collaboration will expand the role of the library within the institution and beyond.
8) Libraries will continue to lead efforts to develop scholarly communication and intellectual property services.
9) Technology will continue to change services and required skills
10) The definition of the library will change as physical space is repurposed and virtual space expands.

21 jun 2011

Store-Share-and-Cite

Donderdag 9 juni werd in de Oranje-zaal in de bibliotheek van de TU Delft een minisymposium gehouden onder de titel ‘Store-Share-and-Cite: Increase your citations by (re)use of research data’.
Het blijkt al de derde bijeenkomst te zijn van 3 TU over Research Data Management. Het verslag van een eerdere bijeenkomst heb ik teruggevonden (22 april 2010 ‘Exciting Research Data’).

Als symbolisch deelnamekado krijgen we een velletje met bloemenzaadjes: dat zowel 3TU Datacentrum als de zaadjes mogen bloeien! Er is helaas geen open wifi, er is wel een hashtag #3tudatacitation maar die is te lang dus ik gebruik #3tudcit. In de pauze wel een stopcontact gevonden, maar de laptop werd helaas niet geladen.

Maria Heine, directeur bibliotheek TU Delft, opent met welkomswoord en middagvoorzitter Erik Soonieus, TUD alumnus introduceert de sprekers.
De eerste spreker is Michael Diepenbroek , hij vertelt over ICSU World Data System, dat gestart is in 1957 t.g.v. het Geophysical Year. De ICSU (International Council for Science) een samenwerkingsverband van Wetenschapsacademies is oprichter van het World Data Center System “The World Data Center system works to guarantee access to solar, geophysical and related environmental data”.
- NB het ICSU Word Data System confereert in september a.s. in Japan.
Diepenbroek, is verantwoordelijk voor Pangea. Pangea volgt de principes en richtlijnen van het World Data Center System.

"The information system PANGAEA is operated as an Open Access library aimed at archiving, publishing and distributing georeferenced data from earth system research. The system guarantees long-term availability of its content through a commitment of the operating institutions".

Voor Pangea heeft hij een model data management opgesteld n.a.v. IODP (Integrated Ocean Drilling Program).


Diepenbroek: “Het grootste probleem is niet technisch van aard, maar semantisch” Bij Pangea werken ze met meerdere projecten, die hebben een eigen portal en geven ook input voor bijv. GBIF en OBIS en ze werken als data warehouse, met diverse standaards voor content en interfaces. Zelfs binnen één community meerdere standaards. Ze doen al 15 jaar aan datapublicatie en hij gaat zelfs zover dat hij zegt dat de enige data die het waard is bewaard te blijven gepubliceerde (= gepeerreviewde) data is.

De 2e spreker Patrick Vandewalle (heeft blog pixeltje.be) is een oud-TUDelft student. Hij spreekt vanuit zijn ervaring bij het schrijven van zijn PhD in Lausanne, het gebruikersperspectief over ‘signal processing’. Hij kreeg vaak de vraag of men zijn test kon herhalen en daarom besloot hij alle gegevens van die tests vrij te geven.
Hij heeft daar zelfs ook een artikel over geschreven ‘Reproducible research in signal processing’ IEEE Signal Processing Magazine 2009 pp 37-47. Hij geeft hoog op van de voordelen voor hemzelf en voor de wetenschap en heeft daar zelfs een website aan gewijd

Het basisprincipe van wetenschap is herhaalbaarheid van de experimenten. Daarop is alles gebaseerd en dat maakt het meer efficient en robust. Geeft je de gelegenheid om zelf verder te werken,zodat anderen jouw werk als uitgangpsunt kunnen nemen en anderen om jouw werk als bouwsteen te nemen en het verhoogt de impact. Zijn werk bestaat uit theorie, rekenwerk en experimenten. Daarvoor zijn verschillende gegevens nodig om dit herhaalbaar te maken. Hij heeft zijn eerste artikel reproducible gemaakt door het inclusief de matlab code online te zetten.
Maar het is nog veel efficienter als je van te voren al weet dat je iets reproducible wilt zetten.
Hergebruik voor hemzelf was efficient, mooi demo materiaal, heel veel downloads, mooie reacties en samenwerking (beter om op je schouders te staan dan op je tenen)
Hoe maak je het reproducible:
- Als supplementary material bij publicatie
- Apart in een repository in Eprints
Papers available online are cited 3x more often [Lawrence Nature 2001 `Free online availability substantially increases a paper’s impact´ Piwowar in PlosOne 2007 ‘Sharing Detailed Research Data Is Associated with Increased Citation Rate

Philippe Terheggen van Elsevier belicht ten slotte de rol van de uitgever. De komende 50 jaar, Aldus Terheggen gaan over datamining (4th paradigm zie Harvard business review 2010 )
“Access vs importance : datasets are seen as important but accessible is usually low”
Er zijn 4 soorten verrijkte publicaties:
1) supplementary data, (maar er zijn geen middelen om supplements 200 jaar te onderhouden)
2) article linking, (link van een database naar het artikel. De auteur post de link automatische connectie met Elsevier (Nextbio)
3) entity linking,(v an een ander niveau is als je een link hebt in het artikel naar een code met een link naar de data. De auteur heeft die link getagged)
4) embedded apps(PDB Proteine database geeft visualisatie in het artikel en bijv ook Pangea)
Altijd op een non-inclusive basis, de bedoeling is dat het denktijd vermindert die nodig is om naar informatie te komen. “General vision to increase discoverability of science by universal access and integration to data and tools”
Vraag: hoe kun je een artikel meer interactief maken ? bijv. redactioneel comentaar per artikel, misschien ook een discussiepagina, maar hoe kun je dat onderhouden voor al onze tijdschriften?
Copyright is een grijs gebied, er rust geen copyright op supplemnetary data. Copyright gaat vrnl over het format van het artikel.

Jeroen Rombouts 3TuDatacentrum 'Science data services Nl' schets de ‘ANDS Data Sharing Verbs’ Approach , een sort data lifecycle van de Austtralian national data services

Create, Describe & Store, Identify & Rgister, Discover & Access, Exploit

3tuDatacentrum levert 3 diensten:
1) archives (datacite.org = persistent identifier) selection, types;
2) data-labs for working version;
3)data-services like advice, training

Na deze inleidingen wordt er een panel samengesteld uit de sprekers en wij allen in de zaal mogen met stemkastjes (turningpoint click device) op een stelling stemmen.
Stellingen:
1) Every dataset has to be accompanied by publications Y=59% N= 41
JR zou niet verplicht moeten zijn anders word took nutteloze data opgeslagen
Andersom juist wel
Data met metadata kan veel belangrijker zijn dan zonder data
2) Citation to artical with data shoud account for ..% without wegingsfactor (onduidelijk)
3) Citations should contribute to IF of journal (
Zolang je geen credits krijgt voor datasets
4) Change IF to include datasets
5) PhD moet 1 dataset produceren


De stellingen waren niet allemaal even duidelijk, en over de meeste waren we het wel eens: geen dwang, wel faciliteren en financieren.

31 mei 2011

Toekomst academische bibliotheek

Waar zijn we over 5 jaar?
Al sinds het begin van de automatisering – digitalisering van de informatie in het algemeen wordt er gesproken over het voortbestaan van de bibliotheek en de bibliothecaris. Van de opleidingen mocht het beroep niet meer met ‘bibliotheek’worden aangeduid en er volgde allerlei varianten met het woord ‘informatie’ in de titel. Een beetje lastig is dat wel, want je kunt niet meer makkelijk zien in welke categorie iets of iemand valt. Het woord ‘informatie’wordt ook breeduit gebruikt in de automatisering en in bedrijfskundige administratie.
Enfin zelf heb ik ook wel eens een scriptie(tje) geschreven over “de veranderende rol van de bibliothecaris”. Is nog steeds online te vinden en ik sta er ook nog wel achter.
Het basisidee is dat de kern van de bibliotheek en zijn functionaris, niet is dat het een ‘bewaarplaats van boeken is, maar een toegangspoort tot allerlei vormen van gedigitaliseerde informatie. Zoals in een artikel in Chronicle : “Libraries never were warehouses of books. While continuing to provide books in the future, they will function as nerve centers for communicating digitized information at the neighborhood level as well as on college campuses.”
Waar de een, zoals Mackenzie Owen in IP het verwoordt, de overbodigheid van de bibliotheek ziet, ziet de ander de bibliotheek juist groeien. Niet alleen in het fungeren als ‘learning space’(zie ‘de UB als learning space”van G.Lutgens en G.Goris etc) maar ook met de nadruk op speciale informatiediensten. Te denken valt dan aan training in informatievaardigheden en eigenlijk een geheel scale aan ondersteuning in academische vaardigheden. Ook bijv. de support bij het managen van research data hoort daarbij, alsmede het verhogen van het bewustzijn van het belang van informatie en data bij de onderzoekers.
Waar soms ICT-afdelingen en bibliotheken fuseren danwel samenwerken op basis van hun samenkomst op het gebied van software/automatisering, daar spreekt Sue McKnight “Adding value to larning and teaching’ liever over het vormen van organisatorische ‘academic services hub’ een club mensen die de leerervaringen van studenten kunnen transformeren. Ze heeft het dan over testomgevingen in VLE (Virtual learning environments, het toevoegen van content aan nieuwe technologieen.
Het toevoegen van 2.0 diensten behoort ook tot de bibliotheekontwikkeling, speciaal gericht op de digitale, mobiele gebruiker en het vinden van nieuwe wegen om die gebruiker te bereiken
J. Neal en D.Jaggars schrijven het als volgt: “If academic libraries hope to support current and evolving informatonseeking behaviours, they must íntegrate in their users’ network-based workflows by exposing as much content as possible to search engines, making it discoverable where users are most likely to be working.”(Web 2.0).
De rol van de bibliotheek bij het wetenschappelijk publicatieproces wordt groter met de grotere nadruk op open access en grotere toegankelijkheid van informative. Zeker indien het verbonden is met abonnementsprijzen en kosten. Nu al is het gebruikelijk dat de bibliotheek informatie geeft over Open Access publiceren, en het beheer van repositories met daarin het depot van de eigen publicaties. Langzamerhand wordt dit uitgebreid met het depot van data en het managen van research data. Martin Lewis omschrijft in :” The Management of research data” een aantal eisen / activiteiten , zoals adviseren en trainen van onderzoekers op gebied van omgaan met data.
Al deze aangehaalde auteurs hebben een hoofdstuk geschreven in het document ‘ Envisioning future academic library services’ ed by S.McKnight Facetpublishing, 2010
Ook de ARL (Aacademic Research Libraries( en de ALA (American Library Association) hebben documenten gepubliceerd met toekomstvisies, soms zelfs hele scenario’s. De meeste komen min of meer op hetzelfde neer.
De taken en behoeften blijven wel bestaan, meer dan ooit is toegankelijk maken van informatie gevraagd, moeten informatievaardigheden ontwikkeld worden en onderzoekers begeleid en ondersteund. Maar zoals Mckenzie Owen opmerkt, of dat nu in een bibliotheek moet? Ja dat is de vraag, enerzijds wat is er specifiek bibliotheeks aan een high tech project- en samenwerkingsruimte?
Bij veel bibliotheken zie je ook een zijtak als het ondersteunen van het onderzoeksregistratiesysteem (METIS) en bibliometrische diensten. Het is logisch dat zich dat in de afdeling bibliotheek ontwikkelt omdat de bibliotheek al in ondersteuning doet, hetom informatie gaat en raakvlakken heeft met ICT. Maar het hoeft niet en niet voor iedereen is die link meteen gelegd.
In de praktijk is het grote voordeel om als onderzoeksondersteuner in de bibliotheek te werken dat er een ‘ neutrale’ ruimte is. Dat maakt het makkelijker, laagdrempeliger voor de ondersteuning. Maar die fysieke ruimte, met name het boeken-bewaarplaats gedeelte boet wel in aan belang, wat dan nog blijft is een soort van high tech lab, waar je gadgets en tools kunt testen. Ook leuk, interessant en nuttig, maar de raakvlakken met een bibliotheek zijn dan wel erg theoretisch geworden.
De grote universiteitsbibliotheken zullen hun collecties gaan samenvoegen en – zoals ook alle andere informatie op internet als gezamenlijk bezit presenteren. Zoals Lukas Koster en Rosemie Callewaert schrijven “To summarise: the new digital and networked nature of collections of information leads to a focus on new information services, supported by library staff with information and technology skills, in new organisational structures and in cooperation with other organisations.”

Collecties zijn voor kleine academische bibliotheken, zoals de NIOO bibliotheek dan overbodig, zeker als alle wetenschappelijke literatuur open access digitaal toegankelijk is.
Jammer vind ik het wel, maar ik denk toch dat langzamerhand de bibliotheek verdwijnt en daarvoor in de plaats een afdeling Research Information Support komt, hopenlijk met inderdaad een soort ‘ knowledge experience’ center om gagdets, games en tools te testen en te introduceren. Zeker ook met taken op het gebied van de informatie- en academische vaardighedentraining, publicatiebeleid en open access, onderzoeksregistratie en data-archivering. Ook het bijhouden vna portals en ingangen is een mooie taak om toegang voor de eigen groep te stroomlijnen. Onderwerpen genoeg en die blijven heus wel.

Referenties:
McKnight, Sue ( editor) Envisioning Future Academic Library Services: Initiatives, ideas and challenges . Facetpublishing., 2010. ISBN: 978-1-85604-691-6

Staley, David J. and Malenfant, Kara L. (eds.) Futures Thinking for Academic Librarians : Higher Education in 2025. ACLR (Association of College & Research Libraries), 2010.

Mackenzie Owen, John. De Nederlandse Bibliotheek voor het onderwijs: toekomst Hogeschool- en Universiteitsbibliotheek. in: Informatieprofessional (2011) nr 4 p. 18-21.

Lutgens, G. en G. Goris. De UB als Learning Space. In: Informatieprofessional (2010) nr. 11/12.

Koster,Lukas en Rosemie Callewaert. Dicovering The Library Collections: library traditions in the light of the web and its users.


Toegevoegd 7-6-2011:
Verslag van het symposium "Future of Academic Library May 16.17 2011" in Library Journal

20 mei 2011

Open Onderzoeksdatadag

Open Onderzoeksdata dag van Surf georganiseerd in het Trippenhuis van de KNAW, maar georganiseerd door Surffoundation om te laten zien wat de diverse deelnemers als voor activiteiten ontwikkelen op het gebied van onderzoeksdata.
Directeur Surf opent Open Onderzoeksdatadag met beschrijving van populaire, maar al oude thema's: "cloud" en "open". De begrippen zijn niet nieuw en al tientallen (cloud/web) zo niet eeuwen (open) oud, maar de ontwikkelingen gaan traag, kijk bijv. naar de Berlin Declaration die toch al in 2003 door bijna alle partijen getekend is. Maar Open Access is nog niet echt doorgebroken. Wel veelbeleovend is het feit dat gisteren minister Verhagen van bij de opening vna de digitale agenda sprak over het inrichten van een Open Dataportaal voor overheidsinformatie. (zie info van ministerie, ook Neelie Kroes heeft over Europese open data geblogd)

De Keynote wordt uitgesproken door Jan Luiten van Zanden: “2+1 argumenten voor data-delen” over global economic history ofwel hoe overtuig je collega's van het belang van open opslag
Ook van Zanden is geennieuweling op dit terrein, zo heeft hij al in 2006 een basisartikel geschrven over samenwerking onder de titel ‘Do ut des. Collaboratories as a "new" method for scholarly communication and cooperation for global and world history” [Do ut des = Geef opdat gegeven zal worden] Hij leidt nu een groot project CLIO-INFRA, dat bestaat uit hubs, die samenwerken in collaboratoriess.
Wat zijn nu zijn argumenten voor open data:
- morele argumenten: voortgang van de wetenschap en maatschappelijke investeringen
- nieuwe publikaties mogleijk door samenwerking en vergelijkingen
- workshops voor uitdragen van kennis
- geld, aantrekken van nieuwe geldbronnen
- gezag en het verkrijgen van autoriteit
Hij komt met een mooi historisch voorbeeld over het onbedoeld gebruik van het VOC-archief, doordat bleek dat daat gegevens inzitten over bevolkinssamenstelling van Sri Lanka in die tijd.
De argumenten voor het delen van data zijn: efficiency, sommig onderzoek alleen mogelijk door vergelijking, disciplinerende werking Data Availability Policy [= eis van tijdschriften dat data gedeponeerd wordt).

Voorts komt Wilma Mossink van Surf. Zij bespreekt de rapporten van werkgroep Toegang tot Onderzoeksdata en geeft de handige verkote URL: http://www.surffoundation.nl/ToegangtotOnderzoeksdata . Dat is een iets andere link dan die naar de site van Open Onderzoek, die we (ik) eerder gebruikte.
Over de meeste heb ik geblogd in het kader van een bijeenkomst van het Onderzoeksdataforum.

Ze bespreekt ook al enkele rapporten, dioe nog niet gepubliceerd zijn, zoals het witboek dataprofessionals (werk ik zelf aan mee), DIPP over publiek private samenwerking en CARDS over veilig opslaan en gecontroleerd delen van data.
Ook stipt Wilma Mossink het project PersiD aan over persistente identifiers.
En de algemene aanbevelingen daaruit, voor NWO-KNAW, voor VSNU, voor de uitgevers en voor de instellingen. De deelnemers hebben dit allemaal op een A4-tje meegekregen, ik heb het in dropbox gekopieerd.

Theo Mulder, directeur onderzoek KNAW (en dus ‘onze’ hoofd-directeur) schets het KNAW-perspectief . Hij opent wel heel illustratief door Nederland te schetsen door de ogen van een Amerikaan als ‘shoppingarea’. Wat zijn de argumenten voor open onderzoeksdata? Mulder noemt drie argumenten:
- belastingbetalerargument,
- versnelling van wetenschap en
- kenniscrisis = aantasting legitimiteit van de wetenschap
Extra aandachtspuntje: bij de data zou ook de software open (open source) moeten zijn.
De rol KNAW is daarbij beprkt tot wat zij zelf voor de instituten voorschriven. Onlangs is er een beleidsnotitie ‘Open Access en Digitale Duurzaamheid’ uitgegaan ; er is geld gereserveerd voor Open Access, ieder instituut moet een datanotitie schrijven en iedere onderzoeksplan moet een dataparagraaf bevatten. Er is een ondermeer een flyer gemaakt met meer informatie. Mulder pleit ook voor schaalvergroting (internationalisering): een mogelijkheid om aan het ‘shoppingarea’effect te ontkomen.


Ron Deker van NWO belicht vervolgens het standpunt van de NWO. Ook zij zijn voor open data en ook hij stipt DANS aan het gezamenlijk instituut van KNAW en NWO, dat een voorziening biedt voor het opslaan van data. Hij haalt ook Minister Verhagen aan die die expliciet heeft gezegd "publieke data = open data = gratis data". NWO hanteert een duidelijk onderscheidt tussen publicaties en data. Bij data blijft NWO mede-eigenaar, data moet daartoe goed gedocumenteerd opslaan
NWO wil de bewustwording stimuleren.
Open data is het kunnen verschaffen van toegang (techniek) en het toegankelijk maken (juridisch-inhoudelijk). De beweegredenen van het delen van data zijn: kennisdelen en efficiency (hergebruik).
Als geldschieter kijkt NWO graag naar de efficiency van de subsidie :zij financieren liever één topfaciliteit dan 2 of 3 middelmatige. Zij zijn voorstander van goede citatie (kan door persistent identifier), en ziet problemen bij attributie (erkenning). Uit het publiek vertelt een deelnemer over het gebruik van ISBN aan datasets (bij taalkunde).

Peter Doorn van DANS spreekt als laatste over Dans en over “ Duurzame toegang tot onderzoeksdata”. Hij noemt Easy.dans.nl een soort Youtube voor onderzoeksdata. Hij verhaalt over de historie van Dans: uit 2005 en voorganger Steinmetz archief: over de functies als archief, advies- instelling , keurmerk. Dans heeft proef gedaan met data reviews (online) met een positief resultaat. Er is een rapport van op te halen op de op danssite.
Doorn geeft als aanbeveling mee, om onderzoeksdata te registreren in Research Information Systeem, actueel in Nederland is dat het Metis-systeem.

Ter afsluiting een paneldiscussie: Olv Leo Verdonschot

In 2 minuten mogen de panelleden een stelling verkondigen waarna een discussie volgt.
* Barend vd Meulen van Rathenau: Onderzoeksresultaten zijn niet uitsluitend afhankelijk van de meetbare prestaties. Ligt bij onderzoekers zelf, die kunnen niet meetbare resultaten, zoals datasets opnemen in zelfevaluatie.
* Karel Moons UMCU: Geneeskundig onderzoekers zijn huiverig om kennsi te delen. Ze zien op tegen het veel werk om gbegevens te anonimiseren. Maar ze zijn vooral bang dat ‘anderen’ meeliften met het vele werk dat zij gedaan hebben, zij zijn bang voor onkundig gebruik, onderuithalen van publicaties, who guards the guardians. Er zijn tijdsbeperkingen nodig( bijv. de tijd, die nodig is voor de originele onderzoeker om te promoveren) en publiceren Good Scientific Practice Guidelines
* IJsbrand Aalbersberg van Elsevier houdt zich bezig met het linken van publicaties met data. Elsevier is geen voorstander van copyright op datasets. Ze willen het liefst data in disciplinegeridchte repository met een aggregator als datacite. De data zo goed en rijk mogelijk linken op meerdere niveaus en binnen artikelkan dan een windowgeopend worden voor datarepository.
* Maria Heine, UKB en TUDelft van push naar pull: de 3TTU Datacentrum gaat samenwerken met Dans als centraal expertisecentrum (ev in overleg met e-sciencecentrum) en decentraal opgezet netwerk van locale frontoffice
Laatste vraag “waarom houden de instituten tegen webtrends in de informatie die zij met belastinggeld vergaard hebben voor zichzelf" Ze zien de directe winst niet en ‘voor de een een vak, voor de andere een hobby’

Interessante dag (presentaties en video staan online) , met name doordat het een soort state-of-the-art vertegenwoordigde van de grote financierende instellingen als NWO en KNAW. Waar staan we nu? Het antwoord is: “open als het kan beschermd als het moet”.
Ondanks het hoog mannen-in-pak-gehalte toch een gedenkwaardige middag, wat in ieder geval nog wel gevolg kan hebben voor de positie van de onderzoeksdata in Nederland met wat mij betreft als kernwoorden:
- Meer aandacht - bewustwording
- Zoveel mogelijk open
- Schaalvergroting
- Disciplinegericht

17 mei 2011

Surfconext


Donderdagmiddag 12 mei naar Surf in Utrecht voor een middag-workshop Workshop Surfconext online samenwerken

Ikzelf had het idee dat Surfconext in de plaats zou komen voor Surfgroepen, die uitgefaseerd worden. Ook andere deelnemers bleken dat idee te hebben. Maar toch is dat niet zo.
Surfconext wordt geen volledige dienst zoals Surfgroepen, maar in plaats daarvan is het middelware, die verschillende apps via een inlog met een team verbindt.
- NB de aangekondigde COIN: Collaborative Infrastructure – gaat ook niet door en men gelieve die benaming niet meer te gebruiken:) -

Na een introductierondje, waarbij gevraagd werd om in een woord te zeggen wat je denkt bij ‘Surfconext’(Surf heeft altijd leuke didactische werkvormen) was al wel duidelijk dat het zou gaan om samenwerken, om de cloud, maar dat er nog veel vraagtekens zijn (uitdaging, kans).

Het gaat dus om ‘open social portal’, zoiets als iGoogle, een pagina die je zelf kunt personificeren met gebruikmaking van verschillende gadgets. Daarbij wordt gebruik gemaakt van:
1) Surffederatie, saml één inlog [authenticatie- en autorisatiedienst ]
2) Surfteams, die je overal mee kunt nemen
3) Open social of vlgs Google code
4) Collaboration tools [software om samen te werken zoals webconferencing – Big Blue Button, documenten delen – Liferay, taken delen – Alfresco, vragenlijsten – Foodle]


Surfconext is gebaseerd op Grouper (groups management toolkit) van Internet2, het Amerikaanse Surfnet.

Alle informatie over Surfconext staat bij elkaar op de pagina www.surfconext.nl, ook het filmpje wat we ter introductie te zien kregen.

Daarna mochten we zelf wat oefenen om een gevoel voor Surfconext te krijgen via het demoportaal. We kregen allemaal een inlognaam (Testuser65 voor mij).
In Surfconext kun je tabbladen aanmaken waarop je vervolgens gadgets plaats (beperkte keuze nog maar zo’n 15 stuks). Een beetje als een beperkte Netvibes.
De tabbladen kun je koppelen aan teams (=Surfteams) en die kun je dan met je teamleden delen d.m.v. een snapshot (dus niet gelijktijdig wijzigen en updaten).

En dan kun je dus met die gadgets documenten delen, webconferenties houden, dus chatten, agenda’s bijhouden, datums prikken e.d.
Geen erg specifieke voorzieningen zoals samenwerken met een citatie manager, of in een experiment.

Het idee is dat de aangesloten instellingen zelf een open social portal bouwen en zich dan bij Surfconext aansluiten voor online samenwerken.
Het demo surfconextportal blijft nog tot augustus, daarna wordt het ev aangeboden als voorbeeld voor de instellingen om een eigen portaal te bouwen, als een soort whitelabel portal voor instellingen. Dat komt dan in de basisvoorzieningen. Zelf een open social portal bouwen kan heel basic (helaas moeilijk met sharepoint te combineren).

Op zich vind ik zo’n open social portal wel een goed idee, en ik heb dan ook meteen onze webmensen erop geattendeerd.
Dat wil zeggen ik heb ze een link gestuurd van de Universiteit Twente, die een eigen open social portal heeft (My University) naast hun hoofdpagina. Ook een blog van het bedrijf Q42, dat UT geassisteerd heeft met het bouwen van de portal.

De toegevoegde waarde van Surfconext zit hem dan m.i. uitsluitend in het geauthenticeerd inloggen via Surffederatie.


11 mei 2011

WoS Export onder hoofdletters in Endnote


Soms, meestal bij oudere titels worden de titels van de artikelen in Web of Science opgenomen met allemaal hoofdletters.
Bij het exporteren en inlezen naar Endnote worden deze titels als hoofdletters ingelezen.

Hoe krijg je die titels nu in normale tekst gezet:

1) Via de outputstyle
In principe is het niet erg dat titels in Enndote soms kapitaal, soms niet in hoofdletters staan. Het is de outputstyle die uiteindelijk bepaalt hoe een verwijzing eruit komt te zien.
Bijvoorbeeld je wilt een citatie opmaken conform de richtlijnen van het blad "Ecology".
Dan pas je in Endnote de outputstyle voor 'Ecology' zo aan dat de woorden in het titelveld niet als hoofdletters, maar als in een zin worden geschreven.
Via EDIT - Outputstyle - Edit Outputstyle 'Ecology'
Kies uit het linkse navigatiemenu onder het kopje Bibliography "Title Capitalization"
Verander dit naar 'Sentence style capitalization"
Bewaar de outputstyle als 'Ecology Copy'
Selecteer vervolgens deze outputstyle



2) Via aanpassing van importfilter
De ISI Software Export Helper, die er voor zorgt dat de referenties automatisch in Endnote worden opgenomen maakt gebruikt van het importfilter "ISI-CE.enf".
Als je dit filter aanpast dan worden de toekomstige titels automatisch als niet-kapitaal opgenomen.
Open de Import Filter Manager met EDIT en kies "ISI-CE.enf".
Pas "Field Editing" aan voor Field Editing for TITLE
en verander dit naar to Sentence.
Bewaar de filter.
NB automatisch wordt het bewaard als "ISI-CE COPY.enf"
Hernoem dit naar "ISI-CE.enf" en vervang de oudere versie.



Je eerder ingelezen titels, die nog kapitaal staan, kun je opnieuw inlezen, nu zonder hoofdletters.