Extension voor Google Scholar Bibliometrics #TPDL2013

Laat een reactie achter

A Domain Meta-wrapper Using Seeds for Intelligent Author List Extraction in the Domain of Scholarly Articles. (€) Francesco Cauteruccio and Giovambattista Ianni

In this paper we investigate about automated extraction of author lists in the domain of scientific digital libraries. It is given a list of known “seed” authors and we aim to extract complete lists of co-authors from Web pages in arbitrary format. We adopt a methodology embedding domain knowledge in a unique “meta-wrapper”, not requiring training, with negligible maintenance costs and based on the combination of several extraction techniques. Such methods are applied at the structural level, at the character level and at the annotation level. We describe the methodology, illustrate our tool, compare with known approaches and measure the accuracy of our techniques with proper experiments

Ze hebben een hele leuke Google Scholar plugin voor Firefox en Chrome gemaakt: de Google Scholar H-index Calculator.
Ze kregen daar veel feedback op.
Ziet er echt heel handig uit.

Scholar laat maar een stukje van de informatie die beschikbaar is, bijv, maar een paar van de auteurs.
Met hun tool kun je die opvragen.
In dit paper beschrijven ze hoe ze dat gedaan hebben.
Ze hebben een meta-wrapper gemaakt a la DIADEM.

De resultaten zijn echt vrij goed :

Advertenties

Geef een reactie

Vul je gegevens in of klik op een icoon om in te loggen.

WordPress.com logo

Je reageert onder je WordPress.com account. Log uit / Bijwerken )

Twitter-afbeelding

Je reageert onder je Twitter account. Log uit / Bijwerken )

Facebook foto

Je reageert onder je Facebook account. Log uit / Bijwerken )

Google+ photo

Je reageert onder je Google+ account. Log uit / Bijwerken )

Verbinden met %s