Als de Direct import vanuit Scopus niet werkt…

1 Reactie

Scopus heeft een Direct Import optie voor RefWorks: dat is heel handig en werkt meestal zonder probleem.

(image from http://www.siue.edu/lovejoylibrary/services/instruction/rw_scopus.shtml )

Maar wat te doen als dat niet werkt en er gewoon niets gebeurd?

Je bent inglogd in Scopus en in Refworks, je hebt items aangeklikt en op Export geklikt en de juiste opties aangevinkt, maar er gebeurt gewoon helemaal niets!
En in de Last imported folder van Refworks staan alleen voorlaatste items…

Dan is het tijd voor een softewarematige versie van ‘zit de stekker er wel in’: log overal uit, klik alles uit en doe t opnieuw … en dan werkt t weer.

Advertenties

Proximity operatoren

Laat een reactie achter

De nabijheidsoperatoren zijn een onderdeel van de relationele operatoren en veel minder bekend dan de  Booleaanse AND OR en NOT. Hoe staat het met deze proximity, welke zijn er en wie gebruikt wat?

Webopedia zegt:

A type of operator used by some search engines to improve search constraints by instructing the search to look for words that are within a short distance of each other in a document. For example, using a search engine that supports proximity operators, querying the phrase “cable NEAR modem” will instruct the search engine to look in documents for instances of the words “cable” and “modem” that are near each other. Different search engines will specify different distances that the words must be within.

Het gaat dus om niet alleen om de verhouding tussen meerdere zoektermen -hoe dicht staan ze bij elkaar-  maar ook of de volgorde uitmaakt.
Je komt ook wel de term  Adjacency (ADJ)  of NEAR operator tegen. Meestal is er een maximum aan het getal dat je kunt gebruiken om te zeggen hoeveel woorden ertussen mogen staan (Pandia: the NEAR operator) : de getallen ertussen betekenen soms “tot en met”  (Picarta) en andere keren weer “tot” (Ovid).
Soms  kun je tekens (koppelteken, apostrophe, komma of punt) ook als ADJ zien, nl als ze midden in een woord voorkomen. Dat hangt wel van de vertaaltabel van de database af.
Bij NEAR – soms zelfs bij WITHIN- is meestal de volgorde niet van belang, maar niet elke database ziet dat zo, dus daar kun je niet van uitgaan.

Over het algemeen zoek je met deze operatoren in hetzelfde veld: je kunt dus geen auteur en woord uit de titel -als die in verschillende veldne staan tenminste- met elkaar matchen op deze manier,  en stopwoorden en interpunctie worden niet meegeteld bij het aantal tussenwoorden dat je opgeeft.

CCL

Maakt gebruik van de symbolen !  (volgorde maakt uit) en % (volgorde maakt niet uit) al dan niet in combinatie met een getal:

  • dogs !5 cats (eerst dogs dan max 5 woorden, dan cats)
  • dogs % cats (dogs en cats voor of na elkaar met niets ertussen)

CQL

Maakt gebruik  van de operator “prox”  “adj”  en ‘within” maar in de vorm zoals ze het beschrijven – ADJ “heart attack”- zie je het als eindgebruiker meestal niet, is echt computer taal. Het aantal woorden ertussen kun je vastleggen in je vraag.

——————————–

Tot zover over de standaarden: hoe is het in het gebruikt? Het is een ratjetoe!
Er zijn een paar handige sheets van bibliotheken beschikbaar die er een duidelijk overzichtje van geven zoals deze Truncation and proximity van de  Colorado State universities .

Ovid SP gebruikt Adjacent Adj (in de advanced mode) met een max van 2-99 woorden ertussen:

  • Volgorde maakt niet uit
  • Syntax: ADJ5 (nb er kunnen dus 0 – 4 woorden tussen staan)
  • Vb: dogs ADJ5 cats

Picarta heeft het toch een kunst verheven: ik neem de helptekst maar min of meer integraal op

  • ?, * willekeurig aantal woorden er tussen; van links naar rechts.
    VB: gebruik ? drugs vindt ‘gebruik van drugs’, maar ook ‘gebruik van verschillende soorten drugs’.
  • #  nul of één woord; van links naar rechts
    VB:  gebruik # drugs vindt ‘gebruik van drugs’, maar niet ‘gebruik van verschillende soorten drugs’.
  • ! t één woord;  van links naar rechts.
    VB  gebruik ! drugs vindt ‘gebruik van drugs’, maar niet ‘gebruik van verschillende soorten drugs’.
  • %  woordvolgorde niet is aangegeven.
    VB: john % kennedy vindt ‘John Kennedy’, maar ook ‘Kennedy, John’. Zorgt ervoor dat een operator die standaard van links naar rechts zoekt, tevens van rechts naar links kan zoeken. Bijvoorbeeld : john #% kennedy vindt niet alleen John Kennedy en John F. Kennedy, maar ook Kennedy, John en Kennedy, John F.
  • BIJ, NEAR, ~  1e zoekterm binnen drie woorden van de volgende zoekterm wordt aangetroffen; zoekt twee richtingen op.
    VB: geld BIJ uitgeven twee of minder woorden ertussen
    Vb: geld BIJ/3 uitgeven drie of minder woorden

Web of Science / BIOSIS

Gebruikt SAME en SENT, ze doen hetzelfde. Het is wel volstrekt on-intuïtief als je dat zo moet intikken 😉

  • Volgorde niet van belang
  • Vb: dogs same cats

Scopus gebruikt Precedes by (PRE) en Within (W)

Met een max van 255 woorden ertussen, 0 mag ook, getal is ook echt het aantal woorden dat ertussen mag.  Niet in combinatie met Booleaanse operatoren.

Precedes by: 1e woord gaat vooraf aan het tweede

  • Syntax: PRE/5
  • Vb: dogs PRE/5 cats
  • heart PRE/0 = “heart attack”

Within: volgorde maakt niet uit.

  • Syntax W/5
  • Vb: dogs W/5 cats

Worldcat

Kent geen proximity search in de webversie,  via connexion client wel:

Type proximity operators with (w) or near (n) with numbers (1 to 25) to find multiple terms in one index that have a specified number of intervening words.

—————————————

Zie verder

Maskeren oftewel middentruncatie

Laat een reactie achter

“Iets of niets” dat is de vraag bij het maskeren, ofwel: een maskeringsteken hoort voor 0  of 1 teken te staan in mijn ogen. Maar is dat wel zo? Hoe hoort het eigenlijk? Even op onderzoek uit…

Maskeren -ook wel middentruncatie genoemd- en trunceren zijn beiden ‘wildcards’ ofwel jokers en worden nogal eens door elkaar gebruikt. En er worden ook dezelfde tekens voor gebruikt: #  $  ?  * :  sommigen noemen ook een % maar die laatste (%) ben ik als wildcard niet tegengekomen, wel als proximity operator.

Trunceren =

  • het deel aan het uiteinde van een woord vervangen door een teken dat staat voor alles wat erna (resp ervoor) kan komen.
  • er bestaat rechtstruncatie (alles wat erachter komt) en linkstruncatie (alles wat ervoor komt)
  • dat laatste zie je minder en kost vaak ook meer tijd
  • Vb: bibliot?
  • ?bibliotheek

Maskeren =

  • het vervangen van 1 letter door 0 of 1 teken dat van alles kan betekenen midden in een woord
  • de meeste systemen staan “0 of 1” teken toe
  • sommige systemen staan  precies 1 teken toe, geen 0
  • sommige systemen staan toe dat je dat teken herhaald: voor elke letter moet je dan het symbool zetten
  • soms betekent het symbool ‘alle tekens die ertussen kunnen’
  • Vb: wom#n

CCL:

Ooit werd hoe het hoort vastgelegd in de  Common Command Language (CCL) (Wikipedia duitse versie), waaruit in 1993 de ISO 8777 volgde en in 2004 de Common Query Language ook wel Contextual Query language CQL genoemd.  In die CCL worden allerlei commando’s  vastgelegd, ook de wildcards.
Zoals ik over truncatie al heb geroepen, vult elk systeem dat helaas weer anders in, maar volgens de universele richtlijnen van de CCL is de standaard voor truncatie een ? en voor maskeren een # . En als je de duitse wiki mag geloven, staat die maskering voor 0 of 1 teken, en niet voor 1 teken precies, zoals vaak aangehaald. Dat “1 teken precies” wordt dan aangegeven met een uitroepteken (!). De ISO 8777   is helaas niet full-text op ’t net, dus ik kan niet nakijken of het daar ook in staat, maar ik vermoed van niet (kan iemand erbij? Geef t even door svp).
Koha heeft een uitgebreid verhaal over de CCL, maar heeft vreemd genoeg als truncatie dan weer een * ingevoerd.
CCL is dus:

  • ? =  alles
  • # = 0 of 1 teken
  • ! = 1 teken

CQL:

De CQL is een systeem dat probeert CCL en SQL te combineren. Op de CQL homepage (van de LoC) wordt niets over trunceren / maskeren gezegd, maar in Pattern Matching’ van A gentle introduction to CQL wordt aangegeven hoe de wildcards  er uit zien:

  • ? = 1 teken
  • * =  alles
  • mogen overal voorkomen en herhaald worden
  • Vb: ?in?s*r

Mooi is dat … hebben we 2 afwijkende standaarden: geen wonder dat allerlei systemen dat anders aanpakken.

————————————–

Wat doen de grote databases  trouwens? (T = trunceren M = maskeren)

Ovid (PsycInfo):

Ovid heeft een uitgebreide helptekst, en hier zie ik weer een nieuwe, die je bij Worldcat ook terugvindt:

Limited truncation specifies a maximum number of characters that may follow the root word or phrase. For example, the truncated search dog$1 retrieves results with the words dog and dogs; but it does not retrieve results with the word dogma

In hun lijstje truncatie symbolen zie ik er ook een die ik nog niet eerder als truncatieteken was tegengekomen:  een  colon (:). Je mag nu al deze truncaties ook bij auteurs gebruiken.

  • T = $  *   :
  • M = ? 0 of 1
  • M = # 1 teken, mag vaker gebruikt, moet meer dan 1 letter aan vooraf gaan:
  • Vb: wom#n mag, d#g niet
  • wagenaar*.au.

Pica

Picarta heeft vrij op t net een oude tekst zoekhulp met info over wildcards (handleiding) maar binnen Picarta is deze tekst aangepast.  (update 16/1: op t net staat ook een nieuwere:  Picarta handleiding zoeken)

Binnen een zoekterm kunnen wildcards gecombineerd worden.

  • T = ? en *
  • M= ! 1 teken
  • M= #  0 of 1 teken
  • M = ? en * vervangt dan alle letters (je mag geen aantal toevoegen)
  • Vb: spa#n,g?
  • Vb: gebruik! vindt gebruikt, maar niet gebruik of gebruiker.
  • micro?p* vindt microcomputer, microscope, microprocessor, etc.
  • micro!p* vindt microsphere, microoptics, etc
  • 199#

Worldcat:

Search help (zoek voor Wildcards) / Quick reference card.

  • T = ? en *  je mag er ook cijfer aan toevoegen dat aantal te vervangen letters aangeeft
  • M= ! 1 teken (uitzetten rechtstruncatie: kan ik niet op de referencecard terugvinden, maar werkt wel)
  • M= #  1 teken
  • M = ? met aantal te vervangen letters
  • Vb: bu?2er = butterfly, burner
  • Vb: colo?1r = color, colour, maar niet colonizer

Scopus:

Only one wildcard can be included in a single term”

  • T = * (links en rechts)
  • M = ? 1 teken
  • M = * 0 of 1
  • Vb: he*moglobin vindt hemoglobine, haemoglobin maar ook hemidemiphosphorylmontotremoglobin

WOS:

  • T = *
  • M = ? 1 teken
  • M = $ 0 of 1

Mijn  eigen bibliotheeksysteem volgt de ISO 8777 met als gevolg dat een ? staat voor een truncatie, een # voor 1 teken als maskering.
0 of 1 kan in mijn syteem niet met een # : en daar kom ik weer met het colour/ color probleem. Ze hebben voor dezelfde oplossing gekozen voor dat “niets of iets” als Scopus, maar dan met een ? middenin het woord.
Maar dan vind je ook alles wat ertussen kan, dus

colo?r = color, colour, colorectal,  colonoscopistentekort ( ivm automatische rechtstruncatie)

en daar kan ik niet tegen … dus heb ik onze leverancier gevraagd er iets aan te doen: maak van # de keuze uit 0 of 1,  of verzin iets anders desnoods, maar die ? middenin een woord is niet handig.
Wat vinden jullie?

———————

Zie verder:

Scopus downloaden naar Reference Manager

1 Reactie

Waarom lukt het nog steeds niet de diakritische tekens uit Scopus goed in te lezen in Reference Manager?

Ik mopperde er al eerder over, en kreeg toen eigenlijk nul op het rekest.  Je zou toch denken dat dat inmiddels is opgelost, maar dat is niet zo. Scopus heeft nu in de ‘help’ het zinnetje toegevoegd:

Older versions of EndNote, ProCite and Reference Manger are not supported because records are using UTF-8 encoding.

Kijk, dat geeft aan waar het probleem zit. ANSI (ASCI)  was eigenlijk lang de standaard voor de tekensets (letters en cijfers) maar ik zie dat dat overal  steeds meer omgezet wordt naar Unicode (of UFT-8). Voor de gewone letters en cijfers is dat niet zo’n probleem, omdat de eerste 256 karakters hetzelfde zijn, maar voor de diacrieten maakt het wel uit.

Scopus biedt nu de mogelijkheid tot ‘Direct export” en dat is heel plezierig: een zoekactie lees je zo meteen in een RefMan database in. Alleen mag je dan hopen dat er geen Franse (Duitse) auteurs, titels, of tijdschriften bijzitten,  want dan heb je een  probleem: een auteur als Côté bijv. is niet behoorlijk in te lezen.

Als Scopus nu de mogelijkheid zou bieden om te exporteren in ANSI formaat, of als RefMan bij de RIS importfilter aangeeft dat dat aan te passen is, was het opgelost. Maar dat doen ze niet.

Wat je nu moet doen is het export bestandje opslaan, openen in Notepad, bewaren als ANSI en daarna pas inlezen in RefMan.   Ook voor versie 11, de update die we niet zo lang geleden hebben aangeschaft. Dan gaat het wel goed, maar echt gebruikersvriendelijk is het natuurlijk niet.

EndNote is sinds versie 8 compliant met UFT-8, dus die heeft daar geen probleem mee:  RefMan en Procite wel. Het ziet er naar uit dat de leverancier RefMan aan het afbouwen is: 8 jaar geleden presteerde het beter dan EndNote, nu niet meer: zie bijv   Endnote X2 versus Reference Manager 12.

Wat te doen? Het was al zo moeilijk om onze ICT te overtuigen om RefMan in het netwerk op te nemen, omzetten naar Endnote , ai… En dan is er nog Refworks, maar dat is niet alleen aanzienlijk duurder, het geeft ook firewall problemen in de combinatie met Word. Zotero is ook geen optie, want ze zijn bij ons Windows-hooked, en Zotero is een firefox applicatie.

Nog even en we kunnen het misschien allemaal wel overslaan en naar Mendeley overgaan….

Scopus en het verschil in de H-index: deel 3

Laat een reactie achter

Het wordt steeds vreemder met het geval van een van onze auteur die voor dezelfde set van Elsevier de ene keer een h-index van 9 krijgt, en de andere keer 16.

Voordat hij zijn auteursgegevens in Scopus had laten aanpassen, had hij aanvankelijk voor de opgetelde auteursvarianten samen een 16, maar omdat niet iedereen aan dat optellen doet, kun je ze laten samenvoegen: toen was hij gezakt naar 9, en daar niet blij mee.  We kregen al een sussend mailtje van Elsevier dat die h-index echt 16 is, maar dat het even duurde voor het effect had. Akkoord, is te begrijpen, niet fijn, maar alla.

Maar nu, ruim een maand later, is dat nog niet aangepast, gisteren dus weer een mailtje gestuurd en eigenlijk meteen antwoord gekregen. Letterlijk zeggen ze dit:

I can confirm that author’s H-index is 16. Because Scopus’ main focus concerns publications after 1996, we leave out all pre-96 articles when calculating this H-index. That is what makes the H-index is this author 9 when looking on his author details page.
Considering all his articles his H-index remains 16.

That is why there will be a discrepancy in H-index, when calculating this from an Author Profile, or via an advanced author search which can find results for pre-1996 content

Maar het is niet alleen de Advanced Search die een discrepantie geeft: de ‘citation tracker‘  geeft het verschil. Was het maar waar, dat de oudere artikelen meegeteld werden, dat zouden onze medewerkers graag zien, maar bij de ‘citation tracker‘ staat met koeieletters boven dat ze pas vanaf 1996 tellen:

Het wordt nl.  nog vreemder:

  • als ik bij de auteur ‘details‘ meteen op de ‘citation tracker‘ klik: dan komt hij uit op 9
  • als ik bij dezelfde set die daar 9 geeft, eerst klik op show en daarna (dezelfde set) op ‘citation tracker’: dan wordt het 16

Dus hetzelfde systeem levert voor exact dezelfde set documenten in dezelfde databse op dezelfde dag met gebuikmaking van dezelfde techniek twee verschillende antwoorden. Daar klopt iets niet Elsevier!

Zouden ze ons echt naar Web of Science willen hebben?  Overigens is zijn h-index daar 13: hij publiceert nogal in congresverslagen en een aantal daarvan worden in Scopus wel en in WoS niet meegeteld, vandaar dat hij daar lager dan 16 uitkomt. Bij WoS heeft hij 63 artikelen, bij Scopus 75.  Van die dingen  dus 😉 .

Aanvulling:  Via Scopus kun je ook de h-index berekenen door op de auteur te zoeken, ze te  sorteren ze op citaties en vervolgens de linkerkolom het H-index cijfer af te lezen. Maar als je via het  Authortabblad naar de auteur zoekt, zie je bij de details meteen het cijfertje van de h-index en de meeste mensen kijken niet verder.  Maar dit systeem blijkt dus niet goed te werken! Elsevier doe er wat aan!.

September aan de hand van de Tweets

Laat een reactie achter

In september heb ik twee van mijn Twitter accounts samengevoegd tot een: eigenlijk ben ik gewoon te lui om mijn privé en werk uit elkaar te houden denk ik 😉 of ik werk altijd, dat kan ook natuurlijk.

Wat mij betreft waren er drie hoofdthema’s deze maand:

  1. Ik heb me enorm geamuseerd met Blip.fm: It’s like Last FM and Twitter had a baby 😉 : je leert veel nieuwe muziek kennen en communiceert met mensen all-over-the world..
  2. Wowter is begonnen met een blogkermis met als thema het bloggen zelf. Nu vind ik dat ‘blogkermis’ een raar woord, maar de gedachte is erg leuk en de meeste posts heb ik ook gelezen: een feest van herkenning
  3. Belangrijke aanwinst afgelopen maand was de Chrome browser van Google, maar die moet je downloaden, en daar ik over meerdere computers werk is dat onhandig, dus heb ik daar dan ook niets over te melden 😉 . Wel kan ik, als je met meerdere computers werkt, Symbaloo als startpagina aanbevelen: dat in combinatie met de toolbar van Conduit bijvoorbeeld zorgt dat je op alle computers eenzelfde toegang hebt.

Verder zijn onderstaande zaken in mijn Twitter filter blijven hangen:

Bibliotheekpraktijk:

Databases:

  • Ovid linkt in hun database naar de Full-text waar je toegang toe hebt, maar die noemen ze niet overal zo:  bij PsycBooks bijvoorbeeld heten de links ‘ Ovid PDF Database’ en daar kijk je snel overheen. Als je de links ook ‘Links’ wilt laten noemen, moet je de ‘Link Target Set’ aanpassen. Dat kun je zelf doen, maar moet je wel weten dat dat daar kan. Het heeft wel meteen effect. September 15, 2008
  • Een RSS feed op de Narcis kon je al een poosje maken, maar de  zoekresultaten waren onhandig te bekijken. Het geheel is beter geworden schreef ik op 12 September 2008, maar vandaag (5 oktober) zie ik dat er al een maand lang niets op is binnen gekomen… hum.
  • In Scopus mag je in veld ‘Authors’ geen 2 auteursnamen tegelijk intikken: het resultaat wordt dan 0, ook al zijn er artikelen waar beide auteurs aan hebben geschreven in de database.  … Raar eigenlijk om dan wel de meervoudsvorm voor de veldnaam te gebruiken. September 08, 2008
  • Bij Scopus kun je uiteenlopende naamsvarianten van jezelf bij elkaar laat schrapen en onder een ingang laat zetten, maar dan blijkt de H-index niet gelijk mee te lopen. Het duurt een hele tijd voor dat doorkomt. Antwoord van Elsevier: je kunt auteur gerust kunnen stellen dat zijn H-index toch niet is gezakt van 16 naar 9, maar eind september was nog steeds de juiste notering niet op alle plaatsen toegankelijk.  September 08, 2008

Lezen:

Wetenschap / citaties

Zoeken

Overige Internet tips

  • Listmixer lijkt me mooi ‘anti-clutter middel’: bewaart je bookmarks maar 30 dagen; zijn ze dan nog niet gelezen: dan worden ze verwijderd.  September 16, 2008
  • WIKINDX free bibliographic + quotations/notes management and article authoring syst. September 14, 2008
  • The Googling deel V is uit: , grappige serie filmpjes die Google maps op hak neemt (the vacationeers). September 14, 2008
  • Gmail ‘clipped’ lange mails. Als je ze dan Forward, zijn ze ook geclipt. En als je ze helemaal bekijkt, kun je niet Forwarden … 02:08 PM September 09, 2008
  • 23 en nog veel meer dingen (Stephen Abrams) is al van februari, maar toch nog wel de moeite September 05, 2008
  • Karin Blakeman heeft weer een nieuw lijstje met top 10 business research tips gepubliceerd: Twitter nu ook erbij. 08:27 AM September 05, 2008
  • 50 Ideas on Using Twitter for Business van Chris Brogan. September 12, 2008

Scopus en het verschil in de H-index: deel 2

1 Reactie

Vorige week schreef ik over het verschil in h-index via de Details en het traject: ‘All documents> citation tracker ‘. In het ene geval kreeg ik er 9 uit, en in het andere geval 16, voor exact dezelfde titels.  Alleen als je dan op ‘Exclude Self citations of all authors’ klikte , kwam er weer 9 uit. Dat kan natuurlijk, maar het verschil leek me wel groot.

Elsevier gevraagd en zij bevestigden dat de H-index van de betreffende  auteur 16 was: het had mogelijk te maken met de korte termijn dat het geleden was dat de samenvoeging plaats vond.

Als ik vandaag exact hetzelfde doe, krijg ik in er weer precies hetzelfde uit: Detail = 9, All documents = 16. Maar nu levert het uitsluiten van de zelf-citaties geen verschil op en blijft het 16 ….  die zelf-citaties waren daar dus het probleem niet.

Deze ga ik in de gaten houden: wanneer worden de details nu ook 16?

BTW: zou Elsevier zich realiseren wat een consternatie ze hiermee veroorzaken bij de auteur? Maar ik was wel blij met hun snelle reactie op mijn vraag.