What can Linked Data do for Digital Libraries? #TPDL2013

Laat een reactie achter

Keynote Address by Soren Auer
What can Linked Data do for Digital Libraries?
Chaired by Trond Aalberg
Hall: Grand Ballroom

The paradigm of publishing and interlinking structured data on the Web got quite some traction recently. In this talk we will give an overview on recent developments in the Linked Data realm. We will have a look on how Linked Data can contribute to making Digital Libraries and the rich, qualitative content therein more accessible, inter-connected and attractive. As the Web evolves from a medium for document exchange to increasingly facilitating data exchange, Digital Libraries will also evolve from document repositories to knowledge hubs. We will discuss some challenges and opportunities on that road.

Sören schrijft veel: ‘Sören is author of over 80 peer-reviewed scientific publications resulting in a H-index of 20’
Jeetje.
‘He aims to combine strong theoretical results with high-impact practical applications’ kijk dat is een goed idee.

Sören deed altijd al wat ‘digital library stuff’ maar noemde het niet zo.

Waarom hebben we een Data Web nodig?
Van sommige dingen heb je al geleerd dat je ze niet via Google kunt vinden, al is die informatie wel aanwezig, de reden is dat de integratie er niet is: de achtergrond informatie is dan niet, of niet gestructureerd, aanwezig.
Het is van belang nieuwe strategieën daarvoor te ontwerpen.

De informatie is er nl wel en zelfs gestructureerd, maar dan in databases zelf.
Via RDF kun je informatie uit diverse bronnen integreren.

RDF data model met triples.
Triples komen uit de natuurlijke taal, je kunt er allerlei informatie in kwijt.
Dat kun je op web zetten, de machine vindt de triples en de mens zelf zoekt.
Als je dat in een relatated database doet wordt het erg rommelig.

Pragmatische ontwikkeling van het semantische web.

Het paatje ‘Emerging Web of Data’ van twee jaar geleden werkt intussen niet meer: het web is intussen zo groot geworden dat je het niet meer in een enkel plaatje kwijt kunt.

LOD2 project lifecycle Linked Data.
Extractie uit gestructureerde en semi- gestructureerde bronnen.
Opslaan van triples in Triples stores.

Authoring: iedereen zou informatie moeten kunnen toevoegen.
Linking en interlinking: dat wil je niet handmatig doen, dus heb je op basis van heuristics systemen nodig die dat doen, maar die hebben wel een menselijke verificatie nodig, dus niet puur automatisch.
Verrijking: er zijn upper levels structuren van de basis gegevens van ontologieen nodig.
Kwaliteitsanalyse: data web heeft ook grote variëteit in kwaliteit. Op zich is dat niet erg, maar we moeten wel weten wat de kwaliteit van een bepaalde dataset is. Het ligt aan je doel of de kwaliteit van een bepaalde set voldoende is of niet.
Evolutie van de data : web moet dynamisch zijn
Exploring data: het web staat nog in de kinderschoenen, er zijn betere tools nodig.

Diverse componenten van Lod2 zijn al beschikbaar of  komen op korte termijn ter beschikking.

Wat is een digital library?
‘Zoeken naar ‘stuff’ en ernaar kijken’ is wat een gewone bibliotheek doet.
Een digitale bibliotheek doet hetzelfde en geeft ook toegang tot digitale items, althans, dat zou je in eerste instantie zeggen, maar dat is niet het enige, noch is het voldoende.
Een digitale bibliotheek zou ook een methode moeten geven om naar nieuwe wegen van informatie te kijken. Knowledge Hubs. Kennis delen op het web. Nieuwe technologieën, dat geeft ook nieuwe toepassingen.

Artefacten: zijn bij voorbeeld ook thesauri, data, semantic network, etc.
Nieuwe vormen van samenwerking zouden onderzocht moeten worden en nieuwe artefacten als Linked Data, mashups, wikis, courseware, etc ingevoerd
Dingen waar we eerder niet aan dachten.

Ontowiki (lijkt nu even niet online te zijn -later wel-, maar wel online is http://semanticweb.org/wiki/OntoWiki)

Een voorbeeld is dit:

Ontwiki

 

Cortex : semantic digital library search backend.
Alles zit in de database: alle Europeana informatie is in triples ingevoerd in die database.
De response erg goed. Voorbeeld https://www.deutsche-digitale-bibliothek.de/

Slidewiki :
Platform open access voor presentaties per slide (vanaf vandaag toegankelijk).
Je kunt steeds de presentaties updaten, de vertaling gaat automatisch.
Er is een lijst met mensen die er aan bijgedragen hebben, zoals bij Wikipedia.
Iedereen kan vragen stellen, en die zijn gekoppeld aan de slide zelf.
Voor Prezi werkt het ook.

Voorbeeld van slidewiki:

Slidewiki

 

SemanticPapers
Gestructureerd noteren van wetenschappelijke informatie. Onderzoekers zijn veel tijd kwijt met informatie in tekst te zetten. Kan dat eenvoudiger?
Annoteren van papers op een semantische manier.
RDF triples koppelen aan stukjes tekst. (is dit minder werk? lijkt me behoorlijk ingewikkeld – of veel werk- om te doen als ze dat zelf moeten doen ). Sören zegt dat reviewers toch moeten annoteren. Als ze dat gedaan hebben kun je wel meteen zoeken in de database naar ‘Similar papers’ . Dat is wel een voordeel. (vraag is wel hoe goed ze dat dan doen: is wel een methode om onder water wat ‘onzin’ toe te voegen.)

Authoring semantic annotated annotaties text.

Extract informatie uit bestaande repositories.

Digital Libraries moeten nieuwe typen gestructureerde artefacten ondersteunen en interacties mogelijk maken.

Wauw, interessante tools, leuk praatje .


Opmerking uit de zaal: Annoteren doen mensen zelf achteraf niet, daar hebben ze geen tijd voor, maar voor studenten zou het een mooie tool zijn.
Antw: Voordeel is ook dat als je gemakkelijker te vinden bent je vaker geciteerd wordt, en door deze semantische verrijking wordt je sneller gevonden.
Mogelijk kun je het crowdsourcen of automatisch laten doen.
Opm van Christine Borgman :
de traditionele uitgevers strippen dat er gelijk af en maken er een pdf van.
We moeten dan naar andere manier van publiceren.
Antw :
je kunt ook buiten uitgevers om je artikel opslaan in Google docs, kleine OA tijdschriften of een repository.

Slides presentatie

Advertenties

Geef een reactie

Vul je gegevens in of klik op een icoon om in te loggen.

WordPress.com logo

Je reageert onder je WordPress.com account. Log uit / Bijwerken )

Twitter-afbeelding

Je reageert onder je Twitter account. Log uit / Bijwerken )

Facebook foto

Je reageert onder je Facebook account. Log uit / Bijwerken )

Google+ photo

Je reageert onder je Google+ account. Log uit / Bijwerken )

Verbinden met %s