Web 3.0 – ook wel het semantische web genoemd – is dichterbij dan iedereen denkt.

Ivo Zandhuis
Wat wordt nou precies verstaan onder ‘Semantisch Web’? Sir Tim Berners-Lee, de grondlegger van het World Wide Web, heeft het ooit gedefinieerd als “a web of data that can be processed directly and indirectly by machines”. Maar er zijn ook andere definities, waarvan sommige eerder thuishoren in de wereld van de science fiction dan dat ze gebaseerd zijn op science faction. Ivo Zandhuis (zelfstandig consultant) leidt het debat. Edgar Meij (Universiteit van Amsterdam) gaat in op de ontwikkelingen van information retrieval. Lukas Koster (Bibliotheek van de Universiteit van Amsterdam) belicht het fenomeen Linked Open Data. En studenten van IDMdenhaag presenteren een praktijkvoorbeeld van semantic networks bij IDM.
Zo, de studenten van de IDM wel … dit is eigenlijk iets waar ik al een poosje meer van wil weten. Zou eigenlijk wel een cursusje Semantisch web/zoeken willen volgen (GO??). Worden we wijzer vandaag?
Ivo Zandhuis heeft een eigen bedrijf en twittert.
Over het proefschrift van Edgar Meij schreef de Automatiseringsgids in 2010: Promovendus maakt zoekmachines slimmer . Aldoor al van plan om dat te gaan lezen, maar is er maar steeds niet van gekomen. (luiheid natuurlijk).
Lukas kennen we natuurlijk als Tweep en als blogger (en bierdrinker).
Mollema en drie studenten.
———————
Het live verslag.
Ivo heet ons welkom.
Eerst drie kwartier discussie en daarna drie prestaties van een half uur. (Die doe ik apart denk ik)
………
Meeste mensen uit zaal komen uit de academische bibliotheek, een deel uit de bedrijfsbibliotheek, paar OB, paar erfgoedinstellingen en enkele ICTers.
Stellingen om uit te zoeken hoe we er in staan:
1) web is goed zoals het is. hoeft niet verandert.
Niemand onderschrijft dat.
Laten we voorbij catalogus denken, het gaat om toegang tot informatie waar die ook vandaan komt.
Bekende kreet: ‘Geen collectie maar connectie’. Lucas is het daar niet mee eens. juiste wel collectie, maar een andere invulling aan het woord collectie geven.
Computer trainen om je te begrijpen.
2) Linked data is voor techneuten, daar heb ik niets mee te maken, hoef ik niets van te weten.
Deze sessie is niet voor techneuten.
Vraag uit de zaal: zeg eerst eens waar het over gaat.
Anwoord: Relatie tussen dataelementen leggen, connecties leggen tussen je catalogus en informatie elders.
Zelfs techneuten hebben soms moeite het te volgen als het over linked data/semantische web gaat, zegt een van hen.
Dit onderwerp heeft een belangrijke technologische component, maar op zich kun je eigenlijk nu ook al relaties leggen.
Rol IPer gaat erom te weten wat er kan.
3), Linked data is nog te prematuur
Vraag uit de zaal: keer t programma om, laten we eerst presentaties houden, dan weten we waar we het over hebben.
____________________
Edgar Meijaan het woord.
Wat betekent semantisch zoeken.
‘gewoon’ zoeken via Google, maar Bing, Yahoo.
‘watson’ zoeken: vraag op antwoord geven, maar Watson is niet altijd even slim.
Zoeken
Verbetering wordt steeds moeilijker te realiseren : snelheid, de nadruk ligt op rekenkracht.
Uitdaging : begrip van cognitie, hoe pakken mensen probleem aan, begrip op.
Dieper begrip van queries en content
Verschil Paris Hilton is dat een persoon of een hotel in Parijs.
Nu krijg je al vaak een interpretatie van je zoekvraag als je bv zoekt naar Wenen, Oostenrijk komt de zoekmachine met een kaart, en met suggestie wat er te doen is.
De zoekmachine moet al vrij zeker weten wat men wil, anders werkt het contraproductief en gaat vraagsteller weg naar een ander systeem.
Nieuwe zoeken
Rijker zoeken heeft semantisch zoeken nodig.
De onderdelen:
- Aggregatie
- voorspellingen
- semantische profielen
- semantische queries
- complexere taken.
Combinatie zoekvraag en documenten
Vertaling van queries naar andere presentatie.
Snap to grid. Bv Starbucks Schiphol = Het bedrijf en de locatie
Je ziet dat nu al als je naar Reehorst Ede zoekt in google, dan krijg je al aggregatie waardoor het resultaat op een bepaalde manier wordt gepresenteerd: de map, de prijs van een kamer etc.
Harrison Ford zoeken in Yahoo geeft ook iets vergelijkbaars: hij weet dat t een filmster is, foto’s films, persoonsgegevens.
Semantisch web
Gaat om link van data linked data en RDFa (Resource Description Framework)
Grote instellingen gebruiken Linked data.
RDFa de opmaak in XML bijv een persoon met onderliggende gegeven als naam, adres, land, beroep.
rNews (embedded data in online news) is de nieuwe standaard als specificatie voor RDFa: hoe geef je in je artikel aan waar het precies om gaat. Zo wordt het voor een machine gemakkelijk om gegevens aan elkaar te koppelen.
Schema.org
Gestandaardiseerde RDFa.
Wat kun je er zelf mee?
Zoekvraag komt binnen, zoeken, ranking, presentatie aan gebruiker.
Impliciete data is data die jijzelf toe kunt voegen aan documenten.
Informatie extractie.
Er zijn tools die in de tekst als ze dit soort info vinden dat kunnen linken aan een ander bestand bijv persoonsnaam aan wikipedia.
Fietstas bijv, dat is tool dat ze in Amsterdam gebruiken als text analyse tool.
Vraag: wat een bibliotheek bijdragen?
Data. Mankracht.
We zijn teruggekomen bij kennisindeling.
Een goed onderhouden thesaurus is van groot belang. Met name voor obscure collecties.
Bibliotheek weet veel van gebruik van collectie.