2 okt 2013

TPDL 2013 Semantisch Web


Dinsdagnamiddag kregen we nog een plenaire bijeenkomst rondom het semantisch web.
Semantic searching was al eerder ter sprake gekomen, en bij veel onderzoeken kwam het woord 'semantisch' op de een of andere manier naar boven drijven.
De officiële W3C website zegt erover:
The term “Semantic Web” refers to W3C’s vision of the Web of linked data. Semantic Web technologies enable people to create data stores on the Web, build vocabularies, and write rules for handling data. Linked data are empowered by technologies such as RDF, SPARQL, OWL, and SKOS.
En vooral RDF, SPARQL en OWL kwamen uitbundig aan bod.

Hierarchical Structuring of Cultural Heritage Objects within Large Aggregations
Shenghui Wang van OCLC sprak rondom het probleem van duplcaten in Europeana, hoe die op te sporen en te categoriseren. Immers eenzelfde beschrijving kan meerdere kanten van een object belichten, de bedoeling is dan die bij elkaar horende of op elkaar gelijkende objecten aan elkaar te linken. Ze gebruiken daarvoor de techniek van iteratieve paralelle clustering met minhashes (min-wise independent permutations locality sensitive hashing scheme).
Methodology for Dynamic Extraction of Highly Relevant Information Describing Particular Object From Semantic Web Knowledge Base
Krzysztof Sielski noemde Clepsydra, een aggregator die de collecties van diverse bibliotheken samenbrengt in een knowledge base. Ze gebruiken daarvoor een RDF database en SPARQL queries gebaseerd op de FRBRoo Ontologie. Met een ontologie maak je een conceptueel schema van een bepaald domein, in hierarchie opgebouwd met aanduiding van onderlinge relaties (een soort thesaurus). In de gezamelijke digitale bibliotheek kun je al, niet helemaal volgens het nieuwste algoritme, maar toch al een aanzet de ontwikkelingen daaraan zien. Als voorbeeld zoeken op Hamlet, biedt dus verrijkte catalogus.

Personalizing Keyword Search on RDF Data
Giorgos Giannopoulos presenteert het zoeken op via ranking algoritmes op een RDF database.

Providing Meaningful Information in a Large Scale Digital Library - a Case Study
Patricia Herterich van CERN over de problemen bij het identificeren van auteursnamen. Met INSPIRE, het informatiesysteem van CERN dat een samengaan is van diverse digitale bibliotheken en systemen. Met het Europese ODIN project, proberen ze, op basis van de ORCID en DATACITE initiatieven verder te bouwen aan een automatische auteurs-identificatie.

Keynote:
What can Linked Data do for Digital Libraries?
Sören Auer spreekt over het LOD2-project, een groot EU-project over Linked Open Data, dat bedoeld is om meer open data aan elkaar te knopen en toegankelijk te maken.
How can we reinvent Libraries online: Digital Library is a Digital Knowledge Hub, exploring new ways of sharing knowledge, not just access to digital stuff
De digitale bibliotheek ondersteunt verschillende soortenproducten, technologieen en interactieve samenwerkingsvormen.
Lod2 heeft een aantal tools ontwikkeld, Ontowiki en Slidewiki, die gebruikt kunnen worden om de wetenschappelijke communicatie te bevorderen.
Lees ook: "Managing the life cycle of linked data with the Load2 stack."
Vervolgens raakte Auer aan een punt want meerdere keren al ter sprake kwam, nl de semantische annotatie:
..publish semantic papers as an intermediate step, not directly in rdf knowledge base but as enriched annotated paper

De conferentie eindigde voor mij met een sessie over Preservation.
Restoring Semantically Incomplete Document Collections Using Lexical Signatures
Luis Meneses vroeg zich af wat er gebeurt als je een document niet meer terug kunt vinden, als er in een reeks iets ontbreekt. Hoe weet je dat? en als je het al kunt reconstrueren hoe betrouwbaar is die reconstructie dan?

Resurrecting My Revolution: Using Social Link Neighborhood in Bringing Context to the Disappearing Web
Michael Nelson vertelt over een tweet-onderzoek onder tweets van 6 belangrijke sociale events (opstand in Egypte, oorlog in Irak etc.) en gaat op zoek naar eventuele ontbrekende link-locaties. Zijn die weer terug te halen? M.b.v. Topsylab konden van een onderwerp dat voldoende tweets heeft een dossier gemaakt worden waaruit ev. ontbrekende link-locaties kunnen worden aangevuld.

Who and What Links to the Internet Archive
In zijn tweede praatje laat Michael L. Nelson zien dat de bestaande web-archieven minder goed zijn als ze beloven.

Aan het eind van de conferentie werd er nog een foto gemaakt op de trappen van het Grand Hotel Excelsior.

Geen opmerkingen: