Exploring Large Digital Library Collections using a Map-based Visualisation #TPDL2013

1 Reactie

Exploring Large Digital Library Collections using a Map-based Visualisation. (€) Mark Michael Hall and Paul Clough

In this paper we describe a novel approach for exploring large document collections using a map-based visualisation. We use hierarchically structured semantic concepts that are attached to the documents to create a visualisation of the semantic space that resembles a Google Map. The approach is novel in that we exploit the hierarchical structure to enable the approach to scale to large document collections and to create a map where the higher levels of spatial abstraction have semantic meaning. An informal evaluation is carried out to gather subjective feedback from users. Overall results are positive with users finding the visualisation enticing and easy to use.

Een bijdrage uit Sheffield.
Ook cultural heritage.
Een searchbox zie je op al die digitale bibliotheek pagina’s. Maar dan heb je wel keywords nodig om op te kunnen zoeken.
Wat als je dat niet hebt?
Hoe maak je de collectie bruikbaar.
Un-focused exploration

Spatalisation: Om de semantisch space om te zetten in een 2 dimensionale ruimte
Maar die zijn beperkt, qua formaat dat ze aankunnen en door de complexiteit om juiste display te krijgen.

Dat kun je oplossen met een hiërarchische structuur, maar hoe kom je daar aan?
Daar zijn er wel veel van: Dewey, LCC, etc.
Maar een grote collectie is vaak samengesteld en heeft diverse hiërarchieën.
Je kunt er een maken vanuit Wikipedia. (link staat in paper). Volledig geautomatiseerde, domein – onafhankelijk en geen specialistisch taalgebruik.
Dan opschonen van de hiërarchie. Daarna Spatalisation.
Boomstructuur platter maken, dat staat beter dan erg diep indexeren.

Wat doe je met dingen die op twee plaatsen kunnen staan?
Zo diep mogelijk in de hiërarchie stoppen.
Op die manier heb je een thesaurus.

Het algoritme werkt bottum up, dus de meest specifieke eerst.

Voor elk topic gaan ze ‘scalen’ dan krijg je veel wit, dat comprimeren ze wat en resultaat is goed genoeg voor hun doel.
Je krijgt dan een soort Google Map waarop je kunt inzoomen.
Bij de eerste test bleek een kwart deze map als voorkeur aan te geven.
Maps gaan op hoger niveau goed, maar lager wordt t minder.
Moet nog wat realistischer worden.
En grote probleem: wat doe je met updaten? Dan moet je alles reprocessen.

Paths project

Leuk!

Advertisements

One thought on “Exploring Large Digital Library Collections using a Map-based Visualisation #TPDL2013

  1. Pingback: Theory and Practice of Digital Libraries : samenvatting #TPDL13 | Dee'tjes

Geef een reactie

Vul je gegevens in of klik op een icoon om in te loggen.

WordPress.com logo

Je reageert onder je WordPress.com account. Log uit / Bijwerken )

Twitter-afbeelding

Je reageert onder je Twitter account. Log uit / Bijwerken )

Facebook foto

Je reageert onder je Facebook account. Log uit / Bijwerken )

Google+ photo

Je reageert onder je Google+ account. Log uit / Bijwerken )

Verbinden met %s