23 jun 2008

Surfgroepen workshop Advanced

Vorig jaar ben ik op 7 juni naar de workshop Surfgroepen geweest (basis). Toen schreef ik als laatste zin in de blog: “Experimenten heb ik inmiddels uitgebreid, maar voor een definitieve introductie van Surfgroepen op het instituut wacht ik tot de update, die is gepland voor deze zomer.”
In december zijn we uiteindelijk toch maar gestart, maar het loopt niet helemaal lekker. Inmiddels zijn er twee grote updates geweest: in de zomer van 2007 en in het voorjaar 2008. Maar het blijft lastig.
Nog steeds heb ik hetzelfde idee: ‘genoeg potentie, maar veel en veel te moeilijk” en dat is eigenlijk nog steeds zo.
Ook op deze workshop voor gevorderden (‘projecten’) klagen de meesten over de moeizame logica en terminologie. Gebruikersvriendelijk noch vanzelfsprekend, dat is het SharePoint programma.
Inmiddels gebruiken we op kleine schaal wel de chatfunctie, middels Windows messenger 5.1, maar de geplande update naar een geïntegreerde IM module is in april net gelukt en gaat waarschijnlijk ook niet in juli lukken. Webconferencing met het geïntegreerde Adobe Connect is ook niet zo makkelijk.
Deze workshop is speciaal gericht op het gebruik van Surfgroepen – dus de door Surf beschikbaar gestelde Sharepoint – speciaal gericht op projecten. Dit is vooral bedoeld als tegenstelling tot gebruik van Surfgroepen in het onderwijs (als aanvulling of zelfs ter vervanging van een ELO).
Mijn doel is om in ieder geval iets meer tips te krijgen, om beter gebruik te kunnen maken van het programma.
En dat lukt ook: wat je moet doen is eigen sjablonen ontwikkelen en die ter beschikking stellen. Op die manier kun je de moeizame terminologie van Microsoft omzeilen en de bedoeling duidelijker maken. Ook kun je daarmee een aantal opties af vangen zodat het programma wat duidelijker overkomt. Helaas kun je moeilijk af komen van de voorkeur die het programma heeft om pas na minimaal vijf stappen ergens te komen 
Het blijft dus voor mij nog twijfelachtig of je je hier nou vol moet instorten. Ook omdat de mensen van Surf zelf duidelijk aangeven dat de ontwikkeling, door gebrek aan ontwikkelaars, niet zo voorspoedig verloopt.
Ik was wel helemaal weg van die nieuwe optie die een betere navigatie mogelijk maakt. Dat ga ik zeker uitvoerig bekijken, want dat kan veel schelen in duidelijkheid.
Het was toch wel een leerzame dag, maar het blijft weerbarstige materie.

Overlevingsgids voor de wetenschapper


Deze gids bestaat uit drie delen: schrijven – presenteren – email en wordt ondersteund door een weblog: de survivalblog for scientist. Het is een initiatief van Ad Lagendijk, als natuurkundig onderzoeker verbonden aan het FOM-instituut.
Het bevat tips die Lagendijk voor zijn promovendi heeft verzameld.
In korte paragrafen (een van de harde richtlijnen is ' maak korte paragrafen') beschrijft hij een aantal wetenswaardigheden. Het geeft mij wel een klein beetje inzicht in hoe hij te werk gaat bij het schrijven.
Hij staat erg wantrouwig tegenover welke software of niet-wetenschappelijke ondersteuning. Enerzijds lijkt me dat goed: een gezonde scepsis t.o. Word bijvoorbeeld is wel op zijn plaats, maar een programma als Endnote is wel erg makkelijk om je referenties goed op te stellen en aan te passen vind ik. Lagendijk is van de harde school: dat doe je maar handmatig.
Hij zweert bij het tekstprogramma Tex, geen tekstverwerker zoals Word, maar een opmaaktaal, met een uitgebreid macropakket LaTex. Tex is vooral bedoeld voor wetenschappelijke teksten met veel wiskundige formules. Het stamt uit de jaren 80, maar er is een downloadversie 2007 beschikbaar (open source).
Lagendijk geeft ook tips over de omgang met referees (die hebben altijd gelijk) en uitgevers. Hij is een voorstander van open acces en vind zelfs dat -ongeacht wat een uitgever zegt – jij als maker recht erop hebt je eigen artikel beschikbaar te stellen.
In de presentatiegids gaat hij uit van het gebruik van PowerPoint: iedereen doet het en het is het beste programma op dit gebied. Advies: langzamer, grotere letters en minder tekst per dia, en nogmaals langzamer!
De ‘echte’ wetenschappelijke discours gaat via de gepubliceerde artikelen en dat moet je dan ook zo houden. Op een conferentie kun je wel iets nieuws presenteren,maar nooit op schrift in hand-outs of in de gepubliceerde ppt opnemen. Die sheets dan vervangen door een dia. Waarop staat dat het binnenkort gepubliceerd gaat worden in…etc.
Wat e-mailtips betreft is zijn uitgangspunt dat de inbox = to-do-list. En stel alles zo lang mogelijk uit, want veel problemen lossen zich over tijd vanzelf op.
Daarna archiveer je je e-mail op onderwerp.
Wat e-mail betreft is Ad best streng: foutloos schrijven en correct van ton en slechts een onderwerp per e-mail.
Al met al een lange lijst van tips, die wel aardig zijn omdat ze een klein kijkje geven in het proces van de wetenschappelijke publicatie, maar niet meer dan dat.

19 jun 2008

Elsevier zoekt nieuwe vormen van publiceren


Via een prijsvraag wil Elsevier ideeën verzamelen om de opsporing en interpretatie van teksten in online journals en databases te verbeteren. Je kunt er 35.000 (1e prijs) resp. 15.000 (2e prijs) US dollar mee winnen.
Zelf zeggen ze erover in hun persbericht: “The Elsevier Grand Challenge: Knowledge Enhancement in the Life Sciences” is designed to generate useful new ideas that will contribute to improving the productivity of life science researchers.”
Uiteraard blijft peer-review het hart van het wetenschappelijk publiceren. Met deze prijsvraag willen ze in contact komen met de wetenschappelijke gemeenschap om te discussiëren over nieuwe methoden van kennisdeling.
Ze richten zich specifiek op drie onderdelen:
- verbeteren van het proces van openbaarmaking van wetenschappelijke content
- efficiënter visualiseren / uitleggen / verbinden van kennis
- gereedschappen ontwikkelingen om impact te meten

Ik vind het wel een goed idee, en ik hoop dat we ook te horen krijgen welke ideeën er allemaal geopperd worden.
Ik neem aan dat ze iets zoeken in de web 2.0 sfeer en zoiets als Nature nu doet: dus preprint services met commentaar mogelijkheid, blogs voor opinievorming en wiki’s voor achtergrondinformatie, discussiefora voor een specifiek onderwerp.
Er is een panel van deskundigen (vnl. Amerikanen) samengesteld die de inzendingen gaan beoordelen. De beoordelingscriteria zijn: kwaliteit, innovativiteit, content, ‘nieuwe kennis’ en uitvoerbaarheid.

17 jun 2008

Seminar Digitale Duurzaamheid (2)

De 2e reeds, een vervolg op de verkennende bijeenkomst in december.
Digitale gegevens zijn vergankelijk en de blijvende beschikbaarheid is een probleem, aldus de directeur bedrijfsvoering in zijn inleiding.
Een andere benadering is open acces,het voor iedereen toegankelilk opslaanvan de resultaten van het onderzoek. DD staan aan het begin nl de duurzame opslag van datasets, open access aan t eind. Na het tekenen van de Berlin Declaration is er nog weinig gedaan (KNAW-verband), behalve DANS en de pogingen om een KNAW-repositoriy in te richten. Vlgs het architectuurplan van I&A is in ieder geval op het basale nivreau, van netwerken en opslagfaciliteiten bij Sara gerealiseerd of in uitvoering. Maar ook op hoger niveau dat van beleid en plan van aanpak van het management moet er in ieder instituut iets gebeur.
“Er is een verschil tussen ontwikkelingen beheer” KNAW zou mn aan het beheer van al die databanken meer aandacht moeten besteden.

NCCD is landelijk bezig met een inventarisatie en vooronderzoek (nog geen resultaten, volgen in september- ), maar KNAW heeft een inventarisatie gedaan en de resulaten daarvan worden nu gepresenteerd.
Er zijn verschillende typen data, er is veel ad hoc en weinig beleid en er is behoefte aan richtlijnen. Het heeft wel tot bewustwording geleid.
Ook nationaale en internationaal is het veld in beweging en een van de ontwikkelingen is de voorkeur die nationale overheden voor open document standaarden.
De standaard voor opslag is het Open Document Formaat. Dat is het formaat waarin gegevens duurzaam (xml) kan worden opgeslagen. Ook Wikipedia heeft er een artikel over.
In de InformatieProfessional van juni stond een aardig stuk over het 'gat in het geheugen van de overheid', de falende digitaliseringsprojecten van de overheid.
Dans presenteert het datakeurmerk met de zware verantwoordelijkheid van de digitale bewaarplaats, die bepaalt ook het formaat (vrnl Dublin Core, maar nu ook meer ddi).
The Data Documentation Initiative (DDI) is an effort to create an international standard in XML for metadata describing social science data.
En bij voorkeur met persistente identifier. Een leuk woord dat de laatste tijd herhaaldelijk rondzingt. De persistent identifier is de definitieve identificatie van een publikatie.
Nieuw is nu het assessment: hoe ga je na of iemand het keurmerk (een keurmerk-logo) verdiend?Er is dan een assessment document waarin staat of en hoe er aan de 17 richtlijnen is voldaan. Keurmerk kan ook – tijdelijk- worden toegekend aan repository die niet een archief zijn. DSA Assessment group uitbreiden met internationale leden. Datakeurmerk = Data Seal of Approvement. Jaarlijks wordt een bevestiging gevraagd of er nog steeds aan de 17 richtlijnen wordt voldaan.
Twee presentaties over ervaringen op de instituten: een van NIOO en een van KITLV.
Saskia vertelt het verhaal over de inventarisatie, het vooronderzoek VLIZ. het huidige project, waarbij gearchiveerd wordt en er richtlijnen worden gemaakt. Het KITLV benoemt 5 'NCDD' collecties: fotocollectie, interviewcollectie, indonesische filmopnames, bibliotheekcatalogus, digitale tijdschriften. Ze willen dataproducent zijn en blijven, maar geen eigen opslag. 'Soms is minder duur en minder duurzaam, goed genoeg”. De image database is via Internet toegankelijk.
Ter afsluiting van het seminar een discussie over de agenda. Met name educatie en bewustwording zullen aandacht krijgen.
Dans, dat zich richt op alfa- en gamma-wetenschappen, is ev. bereid zich open te stellen, vorreerst informeel, voor levenswetenschappen. Omdat er nu 3TU's de opslag van natuurwetenschappen voor hun rekening neemt er landelijk een gat komt vor de levenswetenschappen.

10 jun 2008

ResearcherID

Aan de slag gegaan met de ResearcherID. Aan het eind van het jaar moet ik voor de zogenoemde ‘midterm evaluatie’ weer citatierapporten maken van onze onderzoekers. Met alle moeite die ik de eerste keer had in het achterhoofd wil ik nu toch alvast beginnen om per persoon een min of meer vast overzicht gereed te hebben. En dat kan met het ResearcherID. Ik schreef er al over met de nieuwe versie van Web of Science. Inmiddels ben ik op een punt aangekomen dat ik toch van mening ben dat het voor de onderzoekers handig kan zijn om zo hun publicaties (en citatiescore) te presenteren. En ook voor mijn citatierapporten.
Dus eerst ga ik samen met een onderzoeker aan de slag. Vanuit je persoonlijke registratie in Web of Science kun je naar de ResearcherID site en daar een formulier invullen om je te registreren.
Als je rechtstreeks vanuit de ResearcherID website je wilt registreren moet je eerst een invitatie aanvragen. Kennelijk wordt je registratie in Web of Science dan als invitatie gezien.
Vervolgens maak je je profiel op voor het ResearcherID. Dat levert meteen al een probleempje bij de naamsvermelding van het instituut. Er zijn nu zo’n 12 mensen van het NIOO geregistreerd zijn, maar als je zoek op ‘Institution =NIOO’ zie je er maar 2. De anderen kun je vinden als je zoek op ‘Netherlands’ of op hun naam.
Net als tegenwoordig bij de creditcard betalingen moet je hier in je profiel ook een verificatiecode opgeven. (Nog meer om te onthouden). Na een confirmatiemail kun je inloggen en je publicaties toevoegen.

Je kunt via ResearcherID zoeken in Web of Science, maar slechts op een beperkte manier (alleen met naam en een topic). Dat is wel jammer, ik heb ook nog geen methode gevonden om in Web of Science gevonden artikelen door te sturen naar je ResearcherID, zou toch makkelijk zijn. Wat wel aardig is, is dat je via Endnote (uitvoer in RIS-formaat) zelf titels kunt toevoegen. Zo kun je bijvoorbeeld in Google Wetenschap naar je boekhoofdstukken zoeken, die opnemen in Endnote en via een RIS-uitvoer opnemen in je ResearcherID. Dan heb je een volledige publicatielijst. In je citatiescore staat dan het onderscheid met het totaal aantal publicaties in de lijst en het totaal (uit Web of Science) op basis waarvan de citatiescore wordt berekenend. Dat is mooi.
Voor mezelf heb ik inmiddels ook een ResearcherID, zie het kleine R- icoontje onder mijn foto.
Er is zo ze zien via Google niet veel nog over het ResearcherID geschreven, behalve dan wat attenderingen. Ik lees wel een weblog BBGM waarin hij kritisch is over het ResearcherID en het OpenID aanbeveelt. Maar OpenID is bedoeld om je inlognamen en je codes op Internet te simplificeren, dat is toch wat anders dan een publicatielijst met citatiescore kunnen presenteren.
Er is trouwens ook een Nederlandse OpenID.

4 jun 2008

PDF/A

In het krantje E-Data & research: kwartaalblad over data en onderzoek in de alfa- en gammawetenschappen, lees ik dat de Koninklijke Bibliotheek (KB) haar voorkeur heeft uitgesproken voor een Microsoft add-in bij de conversie naar het PDF/A formaat. Ik lees daarin ook nog dat PdfMaker van Adobe op de 2e plaats komt en in minder mate ook Open Office. Tools die een printerdriver gebruiken om PDF’s te maken zijn minder geschikt voor gebruikers die structuur belangrijk vinden.
Tot zover E-data. Ik had altijd gedacht dat de PDF Maker van Adobe als beste te voorschijn zou komen. Maar eerlijk gezegd weet ik ook niet goed wat PDF/A is.
Dat is dus een ISO-standaard en wel ISO 19005-1 uit 2005 onder de titel “Document Management - Electronic document file format for long term preservation - Part 1: Use of PDF 1.4 (PDF/A-1)” .
Via Wikipedia kom ik bij het PDF/A-Competence Center en daar lees ik dat het idee is ontstaan om van de de-facto PDF-standaard een stabiele industrie-onafhankelijke afgeleide standaard te maken. En dat is de PDF/A geworden. En waarom was het nodig om een aparte standaard uit te geven: “PDF in its native form cannot guarantee long-term reproducibility and not even the “WYSISYG” principle (what you see is what you get).” De oorspronkelijke PDF is een commercieel product van Adobe, dat blijvend ontwikkeld wordt. De PDF/A standaard is gebaseerd op de Adobe PDF Reference 1.4 uit Adobe Acrobat 5. Vroeger werd geadviseerd te archiveren in TIFF formaat, maar nu is dat dus PDF/A geworden. In de weblog van Digitaalduurzaam wordt dit het PDF-Archiefformaat genoemd.
Terug naar de KB, die hebben een document gepubliceerd in 2007 met PDF guidelines en met name hoe je die PDF/a’s moet maken. In een ander document (helaas ongedateerd)hebben ze de evaluatiecriteria gepubliceerd van die conversietools die documenten omzetten naar PDF.
De criteria zijn “ Openness, Adoption, Complexity, Technical Protection Mechanism (DRM), Self-documentation, Robustness and Dependencies” .
Maar dat is nog niet het vergelijkingsrapport. Even verder zoeken dus. Niet te vinden. Wel stuit ik op een overzicht van het project Migratie, waarvan dit test gebeuren een onderdeel is. Rapport komt dan waarschijnlijk nog op deze pagina.
In gesprek met onze ICT-er denk ik dat het verschil hem zit in de mogelijkheid van terugconverteren van PDF naar Word. Want bij een gewone PDF kun je verder niets wijzigen, met PDFMaker kun je het wel weer in Edit-mode krijgen, en opslaan, maar dan is er toch wat gewijzigd. Helemaal zeker weten we het pas als we het resultaat kunnen lezen.