Ecobibl: juli 2008

31 jul 2008

ThomsonReuters nieuws

Zoals Wouter al schreef heeft ISI Web of Knowledge uitgebreid met een functie Citation Mapping.
Ik wilde dat ook eens uitproberen, maar zag net zo gauw hoe of wat. Dus maar naar de site van Thomson voor instructie. Nou mooi niet. Er is wel instructie, maar niet in gewone taal. Er is zo’n vervelende brainshark videoproductie gemaakt. Ik vind dat vervelend omdat het eindeloos duurt zo’n presentatie, terwijl als je het gewoon als tekst opschrijft, je het zo gelezen hebt. Bovendien kan ik hier in Heteren die brainshark niet draaien. Onhandig!!!
Volgens Wouter is het citation-mappen een bijproduct van het ThomsonReuters Innovation, dat een R&D award heeft gewonnen. Nieuwsgierig als ik ben, ben ik aar eens gaan kijken bij het R&D Magazine, die die prijzen uitreikt. Het gaat allemaal over laboratoriumapparatuur, voor zover ik kan zien. Een motivatie kon ik niet vinden. De introductiesite voor het innovatieplatform van ThomsonReuters laat zien dat het hierbij gaat om octrooien en om marketing. Marketing en innovatie zitten natuurlijk erg dicht bij elkaar. Met een goede marketing kun je zelfs oude broodjes als vernieuwend verkopen (of zoiets). Moqub geeft in haar log een keurige inleiding over marketing, maar in de praktijk zweeft er toch een geur van oplichterij omheen.
Enfin, ik zie niets over citation mapping. Ben waarschijnlijk niet bèta genoeg om erbij te kunnen.:-)

O, toch wel. In de gewone HELP van Web of Science staat een uitleg. Je gaat uit van een Full Record, daar staat een Citation MAP knop en vervolgens kun je aangeven of je voorwaarts en/of achterwaarts wilt mappen en hoe diep.Tsja en dan. Het ziet er leuk uit, maar ik had gehoopt iets meer te zien over de relaties tussen de auteurs die geciteerd worden en die zelf citeren. Dus uitgaande van publicatie X, daarin worden 10 oudere publikaties geciteerd, maar diezelfde X wordt zelf ook weer tien keer geciteerd. En zit er nu verband tussen geciteerden en citeerders? Dat zie ik nog niet. Maar het ziet er wel leuk uit en is wellicht een opstapje daartoe.

Terwijl ik op de site van ThomsonScientific aan het rondkijken was, zag ik dat er een nieuwe ‘white paper’ is uitgebracht over Bibliometrics “Using bibliometrics in evaluating research” . Altijd interessant om daar iets over te lezen, temeer daar Thomson toch nog – althans voor ons – het centrale bedrijf is voor de bibliometrische gegevens. Dus een gratis download aangevraagd. Helaas was er geen keuze ’Nederland’ voor het verplichte land-veld, dus heb ik mezelf maar in België geplaatst:-)

En de login namen voor Web of Knowledge, ResearcherID en EndnoteWeb zijn samengevoegd. In mijn feedback had ik daar ook om gevraagd. Dus dat gaat de goede kant op. Nu nog een sorteeroptie in ResearcherID.

28 jul 2008

Access Vervolg

Cursus Access Vervolg in 2 dagen bij Twice. Het cursusmateriaal is gemaakt door The Courseware Company. Nu zie ik dat de cursusboeken gewoon te koop zijn voor 40 euro. De cursus bestaat uit 5 modules: de modules 5 tot en met 9, eerst een verhalende beschrijving, een overzicht van de procedures en vervolgens opdrachten. Twice koopt dit cursusmateriaal in samen met alle voorbeeld databases. Vanuit een database zijn allemaal kopietjes gemaakt, die de situatie weergeven van een bepaalde fase in het ontwikkelproces van de database. Zo kun je met telkens een nieuwe database oefenen.
Wat zat er in de cursus: formulieren, macro’s, vba, beveiliging en beheer, integratie.
Eerst formulieren, subformulieren en gekoppelde formulieren met daarbij behorend het opbouwen van expressies (berekeningen) en het gebruik van besturingselementen m.b.v. de werkbalk besturingselementen. In het begin moet ik nog erg wennen aan de manier van werken in het boek. Het telkens opstarten van andere databases en het volgend van de uitgeschreven demo’s. Ook merk ik iedere keer weer, dat ik nog steeds niet helemaal muisvaardig ben, zeker niet waar het gaat om de knoppen precies op de goede plek te zetten. Gelukkig kun je het met het formulierontwerpgrid uitlijnen.
Met macro’s kun je verschillende acties achter elkaar laten uitvoeren. . Door opdrachtknoppen toe te voegen aan een formulier en daar actie-macro's aan vast te knopen maak je de navigatieknoppen overbodig. Die verwijder je dan via opmaakmenu. Ook kun je met behulp van databasehulpprogramma’s een schakelbord maken. Vroeger was dat dacht ik standaard, nu kun je het zelf aanmaken en bewerken als formulier. Er zitten wel beperkingen op, want hij geeft standaard 8 opties, en als je daarvan een wilt weghalen geeft hij een foutmelding.
Met Data Access Pagina’s kun je formulieren maken in HTML, die via Internet kunnen worden ingevuld. (Is er in Access 2007 al weer uit, advies is om dan SharePoint Services te gebruiken).
Het VBA, Visual Basic Applications stelt niet zoveel voor. Het geeft een blikje in de mogelijkheid die je hebt om achter ieder object een programmacode te hangen, waardoor er een évent’ kan worden uitgevoerd. Belangrijkste is het commentaarteken (apostrof), het commando voor het declareren van de variabelen ‘Dim’ en voor het ophalen ‘Me.’ Beetje oefenen met voorwaardelijke procedures If.. then..else, waarbij de notatie onder elkaar belangrijk is anders begrijpt hij het niet.
Een eyeopener voor mij zijn de beheersinstrumenten, die ervoor zorgen dat je bijvoorbeeld vanuit een Excel sheet, zo een database kunt maken. De analysetool geeft een suggestie voor het aanmaken van tabellen, dus eig. het opsplitsen van de gegevens in tabellen. Ook kun je controleren of je database wel consistent is opgebouwd.
En het maken van replica’s, zodat je met meerdere mensen op meerdere locaties in de database kunt werken en die later kunt synchroniseren. Een andere variant is die waarbij je de database tabellen centraal beschikbaar stelt en iedere gebruiker kan daarop zijn eigen queries, formulieren en rapporten maken: de front-end back-end oplossing.
Het is wel duidelijk dat dit niet (meer) de beperkte Access is uit de kinderjaren. Er zitten aardig wat mogelijkheden in. De 2007 versie is behalve uiterlijk (met het nieuwe office lint) ook intern veranderd doordat de database structuur helemaal gewijzigd is. Er wordt nu een xml-structuur gebruikt, weliswaar een Microsoft XML met diverse data definitietabellen, maar de xml-mogelijkheden bieden zich dus al aan.
Wanneer maak je nu een nieuwe database? Wanneer er een samenhang is en dagelijkse noodzaak gegevens samen te gebruiken. Het gebruik van Access houdt op daar waar complexe berekeningen moeten worden verricht. Over database design: er is een proces van data-analyse (Codd) dat normalisatie heet en dat uiteindelijk de gegevens kan terugbrengen tot entiteiten. Dat wil zeggen tot welke tabellen en gemaakt moeten worden. Basisgedachte is dat samenhangende gegevens een object = een entiteit zijn en dat zijn alle gegevens die afhangen van een en dezelfde sleutel. Zijn gegevens niet afhankelijk van dezelfde sleutel dan kun je stellen dat het een andere entiteit is en dus een aparte tabel voor gemaakt moet worden.
Codd had ik al eerder gevonden met zijn boek over het relationele database model. Van de Twice docent krijg ik nog wat extra documenten om door te lezen.
Al met al was het toch wel een nuttige exercitie, hoewel ik me afvraag of ik het ook niet gewoon thuis had kunnen doen. Maar ja, ga er dan maar eens 2 dagen voor zitten.

23 jul 2008

Endnote veldcodes in Word

De referenties uit Endndote worden als veldcode in Word opgenomen.

• Normaal, bijv. In opmaak voor het Journal of the American Society of Information Technology ziet een referentie er zo uit:
(Garfield, 1979)

• Ongeformateerd is dat:
{Garfield, 1979 #279}

• En met de optie Toon Veldcodes (Atl+F9) in Word (scherpe haken vervangen door vierkante om t zichtbaar te maken):
{ADDIN EN.CITE [EndNote][Cite][Author]Garfield[/Author][Year]1979[/Year][RecNum]279[/RecNum][record][rec-number]279[/rec-number][foreign-keys][key app="EN" db-id="a2rss22wrtadatexpsbp2xv395ptes5t5dv2"]279[/key][/foreign-keys][ref-type name="Book"]6[/ref-type][contributors][authors][author]Garfield, E.[/author][/authors][/contributors][titles][title]Citation indexing-its theory and application in science, technology, and humanities[/title][/titles][dates][year]1979[/year][/dates][publisher]Wiley New York[/publisher][urls][related-urls][url]http://www.garfield.library.upenn.edu/cifwd.html[/url][/related-urls][/urls][/record][/Cite][/EndNote]}

Meestal kunje met Alt+F9 de veldcodes laten zien of weer laten verdwijnen.
Als de veldcodes in hun volle glorie zichtbaar blijven dan is er een standaardinstelling gewijzigd. In dat geval moet je de standaarden aanpassen.
Doe dat in Word 2003 door TOOLS – OPTIONS – VIEW en verwijder het vinkje voor FIELD CODES.
In Word 2007 doe je hetzelfde via de route - WORD OPTIONS – ADVANCED – scrol naar SHOW DOCUMENT CONTENT - en verwijder het vinkje bij SHOW FIELDCODES IN STEAD OF THEIR VALUES.
Daarna kun je weer normaal opstarten in Word.
Ik kom deze vraag zo vaak tegen, dat ik het nu maar eens volledig uitgeschreven heb.

Tijdschriften stress

Niet alleen apparaten ook de tijdschriften kosten me weer wat kopzorgen.
Begon al met alle Blackwells, die naar Wiley zijn gegaan. Allemaal overgezet en de links aangepast.
Nu heb ik ineens een tijdschrift, wat we al jaren hebben/hadden via BioOne, dat nu rechtstreeks via Wiley moet. Maar daar kunnen we dus niet meer bij. Heb ik kennelijk gemist in de vloed van aankondigingen. Ze schreeuwen het hoog van de toren als een tijdschrift wordt toegevoegd, maar als er een af valt moet je het in de kleine letters zoeken. Nou ja, ik zal wel niet goed opgelet hebben. Dus opnieuw proberen het Journal of Field Ornithology te activeren. Hij is overigens wel bij JSTOR gekomen, dus dat valt weer mee.

Ook in de oceanografie gaat het niet lekker. Sturen ze me uit de USA (Taylor & Francis) een prachtig ingebonden Annual Review Oceanography and Marine Biology. Maar ze sturen niet editie 2008, maar die uit 2006, die we twee jaar geleden ook al hebben ontvangen. Trouwens als je op de site bij Taylor & Francis naar deze titel zoekt, krijg je een mooi zooitje! Overzichtelijk is anders, geen wonder dat ze de verkeerde gestuurd hebben.

.
Vandaag al twee keer een pdf naar iemand gestuurd die dat zelf ook uit onze collectie had kunnen halen. Wat is er mis, staat het niet duidelijk aangegeven dat we wel toegang hebben tot deze tijdschriften? In beide gevallen ging het om tijdschriftjaargangen uit de zeventiger jaren, een keer het Journal for Bacteriology (een ASM-tijdschrift: oudere zijn open access) en een keer een SpringerLink tijdschrift (Oecologia). Nou ja, het zal de zomer zijn

Herinnert me er wel aan dat we een proeftoegang hebben tot linksolver van Ebsco, daar moet ik ook naar kijken. En die van de andere providers wil ik ook regelen.
Een vage brief van Ebsco, dat zij al onze tijdschriften willen beheren (ja, dat zal best...) Maar wat moet ik daar nu mee. Eerst maar eens de huidige abonnementen vernieuwen.
Ik krijg trouwens ook iedere maand een overzicht van Ebsco met allerlei voor mij niet interessante gegevens, zoals dat het tijdschrift ‘American Theology Inquiry’ aan hun bestand is toegevoegd. Heb nog een stapeltje van een aantal maanden liggen, want ik ben alsmaar bang dat er wel een interessante tussen zit. Zouden ze toch eigenlijk ook meer op maat kunnen aanbieden.
JSTOR doet dat ook, maar dan per mail. En zo krijg ik toch aardig wat uitzoekwerk binnen.

Van sommige uitgevers krijg ik iedere maand een mailtje dat de statistieken zijn bijgewerkt. Vind ik best, maar ik bekijk ze maar 1x per jaar t.b.v. de abonnementenevaluatie.

Van een tijdschrift Atomic Spectoscopy, dat we in 2005 hebben opgezegd, krijgen we een brief, dat we al sinds 2006 het abonnement niet meer betalen. Klopt! Dat doe je niet meer als je hebt opgezegd.

En gisteren tijdens de koffie vertelde een medewerker, die tevens eindredacteur is van het ISME Journal, dat het zo onrechtvaardig is dat de impactfactor voor een tijdschrift per kalenderjaar wordt berekend. Dan tellen de artikelen die in het december nummer gepubliceerd worden dus minder zwaar mee dan de januari-artikelen.

Tsja, om met Reve te spreken:
“'God, ' zo dacht Wessel, 'streefde wellicht naar gerechtigheid, maar in Zijn schepping was die niet of nauwelijks te vinden.'Wessel gevoelde medelijden met alles: vooral met meneer Hoorn, maar ook met pijn lijdende dieren; ambtenaren; omgewaaide bomen; geknakte bloemen; en ook, niet te veel maar ook niet te weinig, met zichzelve: het leven was een strijd”
uit: Het hijgend hert / Gerard Reve. Veen, 1998. ISBN 9020456555. p. 100.

Apparaten stress

Deze week weer helemaal in de weer met allerlei apparaten. Om te proberen ze te laten doen wat ik het liefste zou willen.
Mijn nieuwe laptop wil ik graag met een aparte partitie op de harde schijf voor de data. Maar met Vista is dat toch nog niet zo eenvoudig. Van al die gigabytes die erin zitten , blijkt toch wel erg veel al opgebruikt aan de basisprogrammatuur (lees Vista zelf). Met vereende krachten weten de jongens van systeembeheer uiteindelijk 50 GB vrij te maken voor een D-partitie.
In de trein naar Wageningen de tablet-pc -features uitgeprobeerd. Ik kan opstarten m.b.v. een knopje, maar inloggen met een vingerafdruk lukt nog niet. Gaat wel komen zeggen de boys. Dan kan ik het scherm draaien en vastklikken op het toetsenbord. Met een speciale pen kan ik dan de programma’s op het scherm besturen. Zelfs tekst intikken. Gaat eigenlijk best wel aardig, hoewel ik ernstig op mijn backspace heb zitten oefenen.
Mijn losse Bamboo-tablet gebruik ik niet zo veel als ik gedacht had. Met mijn verjaardag gekregen, maar ik blijf het een beetje onhandig vinden. Misschien moet ik meer oefenen. Dus ik heb hem nu ook op de PC in Nieuwersluis aangesloten. Varieren tussen pen, muis en toetsenbord is natuurlijk wel goed tegen RSI.
Even een faxje versturen. Lukt niet. Hoezo? Blijkt het apparaat qua fax niet aangesloten. De aangesloten fax staat ergens anders. Begrijpen doe ik t niet, maar de fax is de deur uit.

We mogen niet meer aan het vastgelopen papier trekken in de kopieermachine. De halve ochtend is een monteur bezig geweest het ding weer aan de praat te krijgen. Dit keer had ik het niet gedaan, maar over het algemeen ben ik wel een papier trekker.
Thuis geprobeerd te scannen. Voorheen kon ik een paar pagina’s achter elkaar inscannen,maar nu niet meer. Software van de HP opnieuw installeren. Helpt niet, de ‘dirigent’ doet t niet en blijft t niet doen. Dan maar alleen scannen als afbeelding.
Mijn privé laptop ‘ontnetwerkt’. Dat viel nog niet mee. Nieuwe ge bruikersaccount aanmaken, de document en settings overzetten, via de administrator account, client service voor Netware uitzetten en automatische login aan. Kost me een hele avond.
Wat me ook irriteert is dat er geen ‘proofing tools’ zijn voor Word 2007. Kan ik geen spellingcontrole uitvoeren.

En dan de diascanner. Die deed het niet meer. Hoewel hij maakte een 600% scan van alleen de lucht van de dia. Bleek na veel vijfen en zessen dat ik de hoeveeldheid KB te laag had staan, waardoor alle ruimte alleen al was opgebruikt door een klein stukje lucht. Nooit geweten dat je ook te klein kunt instellen.:)

21 jul 2008

MS Access

Access, dus. Terug naar de cursus database management. Destijds, tijdens mijn doctoraalopleiding aan de UvA, heb ik bij de database-module juist niet voor Access, maar voor CDS-ISIS gekozen. [pff.. ik had een homepagina op wxs, op mijne-mail naam:mheyden, maar is nu allemaal veranderd naar KPN, met onze gezamenlijke inlognaam]. Ik heb toen wel de basis van Access gedaan, maar het stond me altijd wat tegen. De theorie was dat je beter niet een relationele database kon kiezen voor een bibliotheekbeschrijving, omdat de velden te verschillend zijn, dan is een inverted file database aan te bevelen. Maar inverted files als indexeertechniek worden nu overal toegepast. En CDS-ISIS is/was eigenlijk een ‘gewone’ tekstgebaseerde database. Een aardige evaluatie over CDS-ISIS gelezen, helaas ongedateerd en naamloos, maar waarschijnlijk van Egbert de Smet uit 2004. Het blijkt dat het nog steeds bestaat en als open source software verder gaat. Maar het is nog steeds in leven en onder de vlag van de UNESCO.
Maar nu dus Access. Na de data management cursus van begin juli is het wel duidelijk dat ik mijn Access-kennis en –vaardigheid wat moet oppoetsen. De bedoeling is uiteindelijk dat ik als een soort vraagbaak ga functioneren voor de mensen die een Access database willen opzetten. Voor de eenvoudige vragen dan en de werking van de software. Het omgaan met en interpreteren van wetenschappelijke gegevens ligt niet binnen mijn competentie (en ambitie).
Om te beginnen kijk ik op Internet naar een basiscursus Access. En ja hoor, zelfs Microsoft zelf geeft een online cursus ‘Kennismaken met Access` of in het Engels ´Get to know Access´. En ook een handleiding in het Engels. In het Nederlands kun je een handleiding downloaden van de TU Eindhoven.
En zelf ga ik - eind deze week - een vervolgcursus doen in het Open Leercentrum van Twice. Ben ook wel benieuwd hoe zij dat vormgeven. Zelf maak ik tegenwoordig mijn cursus ook als een soort zelfstudiemateriaal. En in het Open Leercentrum is er ook sprake van zelfstudie.

8 jul 2008

Endnote cursus

Maandag naar Wassenaar naar het NIAS. Ook een KNAW-instituut, maar een dat zich – op het gebied van de alfa- en gammawetenschappen begeeft. Zij geven beurzen uit en bij een toewijzing kan een wetenschapper zich gedurende een academisch jaar geheel toeleggen op bijvoorbeeld het schrijven van een boek.
Ter ondersteuning van de staf heb ik een Endnote cursus verzorgd.
Het is wel eens goed om alles weer eens op een rijtje te zetten. En ook in het Nederlands. Voor onze onderzoekers geef ik meestal een Engelstalige instructie en ook alle instructie materialen zijn in het Engels. Uiteraard geeft dat in het Nederlands een vreemde combinatie van Nederlandse en Engelse termen.
Mijn cursus is een hands-on training, in 5 delen.
Ik vertel eerst een stukje theorie en laat dat vervolgens in live demo zien. Daarna kunnen de cursisten aan de slag met de oefeningen. Ik beschrijf de opdracht en handelingen van de oefeningen en stele en aantal vragen. In het werkboek zijn de antwoorden achterin opgenomen.
Het was een levendige cursus, op verschillende niveaus: beginners, gebruikers, gevorderd en alleen systeemtechnisch. Maar het gaf me wel een goed gevoel.
Het geven van een cursus vind ik toch wel erg leuk. Sinds onze eerste Internetcursussen eind jaren negentig heb ik heel wat cursussen gegeven vanuit Andromeda en later X-ref. Maar dit was mijn eerste – externe – NIOO cursus.

3 jul 2008

Oefeningen in Access

Het is al weer lang geleden dat ik zelf een Access cursus deed. Dat zal tijdens mijn masteropleiding zijn geweest bij Riesthuis. We hebben toen geoefend met Access 97 en met CDS-ISIS. Voor een bibliografische database is/was destijdes CDS-ISIS aanbevelenswaard omdat het juist geen relationele database was.

Zelf heb ik in het gebruik met Access altijd het probleem dat je in een presentatie door Access lastig meerdere invullingen kunt maken voor een veld. Zal wel te maken hebben met een zwak ontwerp van de databases die ik gebruik.

Dus zo'n cursus is voor mij ook wel goed. De deelnemers zijn actief bezig en voor sommige is het best wel een opgave. De presentaties in het begin waren wat saaier, maar nu wordt het erg levendig. Bij de oefening gaat het erom een database te ontwerpen van een monster-tocht waarbij een schip een aantal monsters neemt op bepaalde stations en op een bepaalde tijd.

Je bepaald dan eerst de entiteiten, dus wat hoort bij elkaar in een tabel, en dan ga je de tabellen aan elkaar knopen met relationships.

Ik zie al dat ik altijd teveel in afzonderlijke tabellen wil zetten. Maar er kunnen best meerdere velden in een tabel zitten.Wat ik ook merk dat het erg lastig is om de waarden van de gevonden meetwaarde van de namen van de meetwaarden te scheiden.

Het is zaak om de gegevens enkelvoudig vast te leggen zonder dat je 'lege' kolommen of zelfs maar velden creëert.

Ik krijg er toch weer zin in om mijn eigen databases eens goed na te kijk

Workshop Spreadsheets en Databases

2e dag: over spreadsheets en relationele databases.

De voordelen en de nadelen.Spreadsheets zijn oorspronkelijk gemaakt om cijfermatig materiaal te kunnen bewerken. Er zijn veel voordelen (gebruiksgemak en celgebaseerd), maar ook nadelen (herhaling, bovenste rij limiet, kwetsbaar bij zoeken en sorteren).

Een relationele database heeft die nadelen niet, maar is weer moeilijke in aanmaak en gebruik.

[Excel 2007 zou de beperking tot 65.000 records niet hebben, maar verhoogd tot 1 miljoen en 16.000 kolommen].

Er zijn wel een aantal gevaren bij het gebruik, zoals het isolatie van bestanden, bestanden kunnen incompleet, inconsistent en verspreid raken. Maar de conclusie is dat een relationele databank beter is voor het opslaan van data op een geïntegreerde manier, maar belangrijker dan het dataformaat is de aanwezigheid van informatie/metadata.

* Als je spreadsheets gebruikt zorg er dan voor dat het eerste werkblad je metadata bevat.

* Stel je gegevens zo op dat ze bijv. door statistisch programma gebruikt kunnen worden

* Ruwe gegevens en bewerkte gegeven altijd in aparte werkbladen.

Juist omdat eht zo gemakkelijk te bewerken is kun je ook makkelijk fouten maken.

Relationele databases. Definities uit het Computerwoordenboek: " Een complexe toepassing waarmee databases kunnen worden gemaakt, georganiseerd en bewerkt, waarmee gegevens in een door de gebruiker opgegeven selectie kunnen worden getoond en waarmee in sommige gevallen opgemaakte rapporten kunnen worden afgedrukt. Bekende voorbeelden zijn Oracle, Sybase en Informix.".

ook Wikipedia geeft een overzichtje van relatione datasystemen. De Nederlandse versie geeft een beknopte beschrijving en een onduidelijke verwijzing naar het boek van E.F. Codd: The relational model for database management (versie 2 uit 1990). De Engelse Wikipedia is uitgebreider en geeft ook een verwijzing naar de originele Codd uit 1970 in de Communications of ACCM (getiteld "A relational model of data for large shared data banks").

Access is volgens onze docent het meest klantvriendelijke, maar bij grotere bestanden (meer dan 1GB) kun je beter over op SQL (aparte installatie nodig). Er is ook een Open Office variant genaamd BASE, maar die kan nog niet wast Access kan.

Je hebt tabellen (de entitties) met velden (attributen) en relaties tussen tabellen (via de unieke keyfields).

De velden zijn de kolommen in de tabel en worden gedefinieerd met een Naam, Beschrijving en een Datatype.

Wat relaties betreft zijn eigenlijk alleen de 'one-to-many' relaties te behandelen. Een 'one-to-one' wordt gezien als een entity, en een ' many-to-many' gaat via een tussentabel van 'one-to-many' .

Referentiele integriteit is belangrijk, als voorbeeld wordt gegeven dat er geen soort (species) kan zijn zonder genus. In Access kun je die relatie afdwingen.

Met Queries kun je de de databank bevragen, updaten en elementen verwijderen.

Een goed ontwerp zal voorkomen dat er verdubbelingen in data optreden, niet bestaande en niet gevulde velden (nul-records).

Waarom zou je een relationele database gebruiken:

1. foutenvrije gegevens opslag is essentieel voor goede wetenschap

2. combinatie van gegevens is mogelijk

3. berekeningen en analyses zijn geïntegreerd

Ecologische databanken bestaan vaak uit gegevens uit veldonderzoek (monsters en waarnemingen) en/of experimenten. Metadata is belangrijk: wat, waar, wanneer en hoe moet geregistreerd zijn en in de datasheets kunnen de waarden en de links.

Een zware ochtend met veel theorie, maar dan is er weer tijd voor praktische oefeningen.

2 jul 2008

Workshop Scientific Data Mangement 1

Vandaag met de trein naar Oostende ter begeleiding van een cursus / training voor onze promovendi. Het gaat om het beheer van de wetenschappelijke data, die voortkomt uit experimenten / onderzoekingen. De cursus wordt gegeven bij het VLIZ, en organisatie die ons ook ondersteunt bij het archiveren van wetenschappelijke data. Dat wil zeggen de docenten zijn van het VLIZ, we gebruiken de zal van het naastgelegen IODE. Dit de eerste workshop, in november volgt er nog een. Er zijn nu 20 mensen aanwezig, plus een studente, die een beurs heeft en bij VLIZ werkt.
Bij het voorstellingsrondje valt op dat een aantal mensen met name moeite hebben met de veelheid van de data, die uit sommige instrumenten komt. Wat doe je als je bijvoorbeeld dagelijks zo'n 200 overzichten uit je apparaat krijgt.
Deze eerste dag is het voornamelijk een inleiding in de theorie van data management en een demo van de Marine Data Archive en de IMIS en IMERS systemen.
Ze spreken over kwaliteitscontrole door onder meer het gebruik van standaardlijsten, zoals de WORMS, een lijst van alle zeedieren. En over metadata en de standaarden daarvoor, ISO 191115, Dublin Core, Darwin Code en Euring.
Beetje saai, maar dan mogen we zelf een stukje oefenen.
De lokatie is de haven van Oostende, grote zeeschepen varen voorbij.

Pagina's