Ecobibl: Emtacl10 Semantic Web Track

emtacl10:emerging technologies in academic libraries
Na de inspirerende presentatie van Anders Söderbäck (Libris) over het gebruik van Linked data bij Libris, werd deze track vervolgt met een korte presentatie van het nationale Noorse bibliotheeksysteem Bibsys.
BIBSYS Ask - the architecture (BIBSYS) Hans Gundersen
Hans beschrijft de ontwikkelingen rondom de federated search client van Bibsys: Bibsys Ask.
Die is ontworpen volgens het ‘Domain model’. Volgens Wikipedia is een domain model

The domain model is created in order to document the key concepts, and the domain-vocabulary of the system being modeled. The model identifies the relationships among all major entities within the system, and usually identifies their important methods and attributes

Dus ook een beetje het linked data model. Hans noemt verder nog de webservices API, die m.b.v. JSON zijn gemaakt.

JSON staat voor JavaScript Object Notation en is een deelverzameling van de programmeertaal JavaScript. Het wordt gebruikt voor het uitwisselen van datastructuren, met name in webapplicaties die asynchroon gegevens ophalen van de webserver zoals AJAX.

Als ik zo de Bibsys website bekijk is het best indrukwekkend wat ze allemaal doen. In de wandelgangen wordst druk gespeculeerd over het vervolg. Want Bibsys heeft namelijk een aanbesteding uitgeschreven voor een nieuw bibliotheeksysteem. Niet voor niets de aanwezigheid van OCLC als deelnemer. Op de website schrijven ze dat ze nu de uiteindelijke onderhandelingen ingaan. Spannend!

*
Terug naar de semantisch web track op de Emtacl10.
Towards the semantic desktop / Øyvind Hanssen (University of Tromsø)
Het semantisch web gaat over de manier waarop machines het web begrijpen / lezen. Dat kan met RDF (Resource Description Framework) in triples (subject, predicate, object).

Hoe kun je nu desktop resources als semantic web resources gebruiken: bestanden op je desktop (email, fotos, pdfs, webpagina’s) Hoe kun je dat interlinken? Bijv. via persoon, die een workshop heeft bijgewoond naar een paper en email.
De basis daarvan is een RDF repository, een soort database waarvoor je query kunt maken en die als inference engine kan dienen. Aanvullen met plugins en andere applicaties, adapters om bestaande bestanden te gebruiken en ev. ook handmatige annotatie (tagging), en een crawler die bestanden opzoekt. Een onderdeel kan ook zijn die van automatische metainformatie capture, en het beheer van de ontologie. De ontlogie staat centraal bij metadata management . Dat onderhouden zou een rol vna de bibliotheken kunnen zijn. Dit is alles nog slechts theorie. Actieve semantische desktops zijn er nog niet, wel als prototype met KDE. Bijvoorbeeld Nepomuk.

Practical production of linked data / Rurik Greenall (NTNU)
Rurik vertelt over het proces om de TEKORD thesaurus om te zetten in linked data. Daarvoor moest hij op zoek naar een converter-programma die vanuit zijn tekst naar een RDF/XML converter kon vertalen. Bij problemen heeft hij de vraag en antwoord site Semantic Overflow (voor vragen over semantisch web) geraadpleegd.

The strongest link: libraries and the web of linked data / Lisa Goddard and Gillian Byrne(Memorial University of Newfoundland)Ook de Canadese dames van de Universiteit van Newfoundland die na de lunch aan het woord kwamen spraken over RDF-conversies. Zij gaven ook een flink aantal programma’s die al een RDF-uitvoer in zich hebben, zoals Drupal. Fedora , Dspace en Eprints (eerste is CMS, laatsten worden gebruikt als repository software).
- Wijzelf hebben Eprints in de repository, daarmee zou je dus al naar RDF kunnen gaan. Dat moet ik eens nagaan, ook hoe dat zit met ons dataportaal. -
Waarom zou je willen overstappen naar linked data? Omdat je daarmee slimmer kunt linken, je kunt data integreren, vocabulaires koppelen en termen met meerdere betekenissen doorverwijzen. [De Engelse term disambiguation heeft in de Nederlandse Wikipedia ‘doorverwijspagina’als lemma).

Je kunt zowel relatie’s opvoeren en ernaar verwijzen als je eigen gegevens verrijken met inhoud uit externe bronnen.
Omdat bibliotheken al gewens zijn met metadata, en m.n. ook dublin core indeling te werken is er vanuit die groep een intitieatief om de overstap naar RDF te bestuderen de DCMI/RDA Taskgroup
Ze halen Eric Miller aan over de rol van de bibliotheek: de bibliotheken moeten de kracht van hun collecties gebruiken, Linked data betekent ‘the rise of the cataloguer’, er moet immers veel van metadata voorzien woden, er moet meer gethesaureerd worden en gewebificeerd. Bibliotheken moeten van elkaar leren en doorzetten. [Ik meen dat E. Miller sprak op de ALA conferentie: From Legacy Data to Linked Data: Preparing Libraries for Web 3.0.]
Een enthousiaste presentatie, maar ook alleen theorie. Ik hoorda aan de lunch van hen dat ze het zelf nog niet toepassen.

Modelling /Base Bibliotek/ as linked data / Kim Tallerås (Oslo University College)
Om met een pilot project linked data te testen hebben ze een dataset geleend van Nationale Bbibliotheek, een adreslijst van andere bibliotheken mb voor Ibl.
Deze hebben ze omgezet naar RDF (RDFization), er is een onotologie ontwikkeld een XSLT stylesheet ontworpen, vanuit Triple store, naar SPARQL testing , en hermodelleren.
Boek: How to publish linked data on the web
Kim meldde dat hij als amateurs sprak tot andere soortgenoten bedoeld dus voor ‘wandering amateurs” een collega twitteraar hoorde : “wondering amateurs”. Ach zijn wij niet beide...
Where are the killer apps? Niet gevonden (viel toch tegen dat omzetten van een adressenlijstje in een semantisch web format).

Als staart aan deze lange linked data / semantisch web-dag een tussenstap:
Open the silos – free the data: why an API is not enough / Patrick Danowski (CERN)
Bibliotheek catalogi zijn nu een gesloten silo zonder api mogelijkheid
Een api kan informatie toevoegen bij Library Thing, Google Books, Mashups
API kan geen datasets linken, en je kunt toegevoegde info ook niet indexeren, geen standaardformat, geen full text, geen browsing. Je kunt wel alle info via API downloaden, maar dat is niet de bedoeling, API is er niet voor gemaakt. Ook spelen er licentieproblemen bij Api’s
CERN Open bibliographic data project in Marc/XML, public domain license
Danowski’s advies : het gaat niet over full text, maar dat kan vanuit de bibliotheekpositieook niet, blijf dicht bij jezelf, wat kun je zelf doen om open access geschikt te maken.

Talis Aspire: Next Generation Resource List Management /Mark Bush (Talis)
Talis heeft het semantisch library-platform waarin alles samenkomt als project en zij geven een tijdschrift uit genaamd 'nodalities' over semantisch web.
Die Resource List Management tool zei me verder niks, maar een collegan leek het wel aardig om in Blackboard te hangen?)

Via Ronald vanuit Tweet kreeg ik nog de link van de TED presentatie van Tim Berners Lee over linkes data.

Overall conclusie: er is veel gaande op het gebied van linked data, RDF, concept web en semantisch web. Er worden kleine projecten uitgevoerd. De doorbraak killer applicatie is nog niet gevonden. Het kost toch wel behoorlijk wat moeite om over te schakelen, maar het enthousiamse is er niet minder om. Daar gaan we in de toekomst zeker meer over horen.

Ecobibl

Pagina's

1 mei 2010

Emtacl10 Semantic Web Track

Geen opmerkingen: