Zijn de Narcis publicaties wel opgenomen in Google Scholar?

3 Reacties

Volgens de website van Narcis worden artikelen met samenvattingen of full-text geïndexeerd in Google Scholar.

Maar is dat wel zo? Ik heb een aantal Narcis items genomen en daarop Scholar nagekeken.

Dat stemt niet vrolijk: ze zitten er grotendeels helemaal niet in, en als ze er al inzitten, is er geen link naar de full-text van de Persistent Identifier maar van een andere leverancier.

Items uit een paar universiteitsrepositories zijn wel gelinkt: maar zijn ze dat niet gewoon rechtstreeks en niet via Narcis? Ook artikelen met alleen metadata horen in Scholar opgenomen te zijn!

Narcis beheerders: doe er wat aan!

Bijlage (telt niet meer voor de 100 woorden 😉 )

3 thoughts on “Zijn de Narcis publicaties wel opgenomen in Google Scholar?

  1. Dag Dymphie,

    Publicaties belanden vooral via de repositories en (commerciële) uitgevers in Google Search en via die weg soms ook in Scholar, maar zelden of nooit via Narcis. Dat laatste komt volgens mij doordat Narcis de content (zeg maar: de full text) niet zelf heeft. Narcis verwijst er alleen naar. Narcis toont de metadata die ze uit de repositories haalt en vervolgens verwijst ze voor de full text naar de originele bron. Google heft het vooral gemunt op de full text en volgt de weg ernaar toe tot het eindpunt. Zo komt Google bij de repositories en uitgevers uit. Google beschouwt Narcis dus als een tussenstation en passeert deze op weg naar het eindpunt: de content. Google heeft een voorkeur voor de full text en voor de “originele uitegever”. Als een uitgever de publicatie al in Scholar heeft, dan neemt Google niet nog eens dezelfde publicatie op vanuit een repository. En, zoals gezegd, zeker niet van een tussenstation als Narcis. Narcis kan daar niet veel aan doen, het is de manier waarop Google het doet.

    Het ligt dus niet aan Narcis, maar aan de (veeleisende) Scholar “inclusion policies” die te vinden zijn op http://scholar.google.nl/intl/en/scholar/inclusion.html. Ook Search heeft een hele batterij richtlijnen en tips voor “Search Engine Optimization (SEO)”, te vinden via bijvoorbeeld http://support.google.com/webmasters. Scholar put overigens uit de de indexen van Search, dus Scholar is eigenlijk een subset van Search. In het algemeen geldt: niet in Search dan ook niet in Scholar. In Search zitten vooral records uit Narcis die geen publicatie zijn, zoals persoonsgegegevens (auteurs), organisatiegegevens, publicatielijstjes.

    De Philips-publicatie uit jullie voorbeeld zit goed in Google Search via de repository, maar niet in Scholar. De exacte reden daarvan ken ik niet, maar ongetwijfeld voldoet de repository niet aan een of meer van de Google Scholar inclusion guidelines. Een belangrijke guideline lijkt mij het voeren van meta-tags in de html. De Philips repository heeft dat niet. Daar kunnen we in Delft iets aan doen. Erasmus heeft wel meta-tags in de html en die vind je dus ook regelmatig terug in Scholar. Het bestuderen en vervolgens beter implementeren van de Scholar-guidelines kan heel goed helpen. Maar niet voor alles omdat Google ook andere voorkeuren volgt. En ook niet voor Narcis, die overigens wel de meta-tags in de html heeft, maar voor Google toch een tussenstation blijft. Het kan ook een kwestie van tijd zijn, soms duurt het gewoon heel lang (maanden of langer) voordat een publicatie in Scholar doordringt. Updates van de repositories in Delft, waaronder die van Philips, worden dagelijks in de vorm van een Google-sitemap aan Google gestuurd. Dat helpt natuurlijk ook, maar dan vooraal voor Google Search.

    Dat publicaties uit Narcis in Google Search en Scholar zijn opgenomen, lijkt me dus een onterechte claim. Al zou Narcis willen, dan nog denk ik niet dat ze er veel aan kunnen veranderen. Narcis is en blijft voor Google een tussenstation. Dus de oproep op je blog aan de Narcis-beheerders lijkt me ook onterecht. Dat zou een oproep aan repository-beheerders moeten zijn. Voor de Delftse repositories (including Philips) heb ik het genoteerd 🙂

    Een opmerkelijk bericht van Narcis in dit verband: http://www.dans.knaw.nl/en/content/categorieen/nieuws/narcis-reaches-google-page-rank-9. Ik weet niet waarop het bericht is gebaseerd. Het kan waar zijn voor het Narcis-portaal, maar voor de publlicaties in Narcis zal het niet gelden.

    Vriendelijke groet,

    Arent J. Bosman

    TU Delft Library
    Productonderzoeker / ICT Architect

  2. Dank je Arent, een hele nuttige aanvulling.

    Het lijkt er dus inderdaad *niet* op dat de publicaties in NARCIS – waaronder ik dan niet alleen de teksten van henzelf, maar de inhoud van de gezamenlijke repositories versta- alleen in Google Scholar geïndexeerd zijn als de repositories dat zelf zijn.
    De melding in de FAQ klopt dus ook inderdaad niet http://www.narcis.nl/faq/Language/nl#faq13

  3. Beste Dymphie en Arent-Jan,

    Op de blog-post van Dymhpie heeft Arent-Jan een goede reactie gegeven. Aanvullend wil ik daarover nog het volgende kwijt over Google de page rank:

    Google Page Rank is een door Google ontwikkelde maat die het ‘belang’ van een bepaalde website aangeeft. De ranking is gebaseerd op een algoritme waarbij o.a. gekeken wordt naar de mate waarin vanuit andere webpagina’s naar de desbetreffende site wordt verwezen. In werkelijkheid ligt het natuurlijk is gecompliceerder, maar in deze reactie volstaan we met deze beperkte definitie.
    NARCIS.NL had een tijdlang een pagerank ‘9’. Onlangs is deze gewijzigd in ‘8’. Precies zoals Arent Jan aangeeft zegt de Page Rank niets over de afzonderlijke publicaties, maar wel over de website en over hoe informatie gevonden via Google Search wordt getoond: hoe hoger de page rank, des te hoger in het algemeen de plaats in de resultatenlijst.

    Een hoge page rank voor NARCIS is dus in het belang van de repositories, waar de content van NARCIS op gebaseerd is. Bij een zoekactie op woorden worden hits uit NARCIS binnen Google Search vrij hoog op de resultatenlijst getoond.

    Dan (ook aanvullend op de reactie van Arent-Jan) een commentaar op de oorspronkelijke blog-post van Dymphie:

    Wat Google Scholar doet met een aggregator als NARCIS is niet zo simpel te beantwoorden. Zeker is, daar heeft Dymphie een punt, dat niet alle in NARCIS opgenomen publicaties in Google Scholar te vinden zijn. Een simpele zoekactie illustreert dit. Zoek in Google Scholar op site:narcis.nl en je krijgt 162.000 records. NARCIS zelf telt op dit moment 670.000 records, waarvan 265.000 Open Access.

    Overigens, een soortgelijke zoekactie op Google Search (site:narcis.nl/publication) levert ruim een miljoen hits op. Hier zitten natuurlijk dubbeltellingen bij, maar Google Search indexeert dus wel degelijk ook de beschrijvingen van publicaties uit NARCIS.

    De rol van NARCIS is helder: wij harvesten de repositories van wetenschappelijke instellingen in Nederland. Dit geaggregeerde geheel bieden we via een zogeheten SiteMap aan aan Google en Google Scholar. Wat Google er vervolgens mee doet is aan Google zelf. Daar hebben wij geen invloed op, zoals Arent-Jan Bosman al helder omschreef.

    In principe zou Google (Scholar) alle beschrijvingen van publicaties die wij vanuit NARCIS aanbieden kunnen overnemen (wij bieden overigens niet alle records aan Google Scholar aan; records zonder abstracts en/of zonder verwijzing naar full-text worden uitgefilterd). In de praktijk neemt Google Scholar echter niet alles over.

    Met vriendelijke groeten,

    Arjan Hogenaar,
    redacteur NARCIS

    Tot slot, Dymhpie heeft gelijk dat de tekst in faq13 niet correct is. Wij zullen deze aanpassen.

Geef een reactie

Vul je gegevens in of klik op een icoon om in te loggen.

WordPress.com logo

Je reageert onder je WordPress.com account. Log uit /  Bijwerken )

Facebook foto

Je reageert onder je Facebook account. Log uit /  Bijwerken )

Verbinden met %s