Digital Libraries for Experimental Data: Capturing Processen #TPDL2013

Laat een reactie achter

Digital Libraries for Experimental Data: Capturing Process Through Sheer Curation Mark Hedges and Tobias Blanke

This paper presents an approach to the ‘sheer curation’ of experimental data and processes of a group of researchers in the life sciences, which involves embedding data capture and interpretation within researchers’ working practices, so that it is automatic and invisible to the researcher. The environment described does not capture just individual datasets, but the entire workflow that represents the ‘story’ of the experiment, including intermediate files and provenance metadata, so as to support the verification and reproduction of published results. As the curation environment is decoupled from the researchers’ processing environment, a provenance graph is inferred from a variety of domainspecific contextual information as the data is generated, using software that implements the knowledge and expertise of the researchers.

Auteurs van Kings college Londen. Klinkt aardig technisch.
Provenance staat voor de herkomst van een voorwerp of meer specifiek: de historie van eigendom en bezit van een voorwerp en de documenten en registraties die hierop betrekking hebben. De provenance is dan een waarborg voor de authenticiteit en/of de kwaliteit van het voorwerp.
Vaak begint t op de laptop van de onderzoeker, een rommelige omgeving vaak.
Ze namen een groep onderzoekers en keken wat die deden.
Ze ontwierpen een workflow dat ervoor zorgde dat bepaalde zaken vastgelegd werden. Zodat alle tussenliggende stadia en files bewaard werden.
De workflow moet ervoor zorgen dat dat tamelijk moeiteloos geïntegreerd wordt in normale werkwijze.
Van ruwe data naar gepubliceerd resultaat.
Probleem: lokale systemen, eigengemaakte software, interactieve werkwijze, grote aantal files soms
Pro: veel werk qua metadata gedaan dat helpt onderzoekers, veel kan geautomatiseerd worden aan headers ed.
Implementatie : data capture automatisch laten doen en naar archief laten sturen en automatisch metadata extraheren (bijv als onderzoeker file delete of een commando geeft) . Fedora Common repository. Probleem daarbij is de onderlinge verbanden.
Open provenance model.
Bedoeling is de onderzoekers niet lastig te vallen en laten doen wat ze doen. Ze moeten wel wat installeren maar kunnen gewoon werken.
– Het is lastig om erachter te komen wat ze precies doen als je zelf niet goed in het onderwerp zit.
– Complexe relaties

Geef een reactie

Vul je gegevens in of klik op een icoon om in te loggen.

WordPress.com logo

Je reageert onder je WordPress.com account. Log uit /  Bijwerken )

Facebook foto

Je reageert onder je Facebook account. Log uit /  Bijwerken )

Verbinden met %s