Enkele of dubbele aanhalingstekens in een phrase?

Laat een reactie achter

Als je zoekt met een phrase gebruik je aanhalingstekens om te zeggen dat meerdere woorden bij elkaar horen, bijvoorbeeld “motion sickness“. Als je die quootjes er niet omheen zet, zoekt de machine meestal op voorkomen van de losse woorden en wordt je set veel groter met veel onzin items erbij (ruis).

Maakt het uit of je enkele of dubbele aanhalingstekens gebruikt? Maakt het verschil of je zoekt op ‘motion sickness’ of “motion sickness” ?
Of de losse woorden zonder quootjes eromheen?
En wat als het om motion-induced sickness gaat?
Ik ga maar weer eens op zoek:

Google
In alle gevallen vind je in google.nl meer dan 9 miljoen hits. Dubbele of enkele/geen maakt wel zo’n 400.000 hits uit, maar wat maakt dat uit op die hoeveelheid 😉 .
In de google.com versie vind je er net zoveel, maar daar krijg je er ‘refine’ opties bij.

OvidSP PsycInfo 2000 – nu.
In de Basic search maakt het niet uit of je al dan niet quootjes gebruikt, en vind je er 172.
In de Advances Search (mapping uitgezet) ook niet, en vind je er 180.
Het zijn er inderdaad 8 meer, en die 8, dat is wel interessant, haalt hij uit de Key-concepts en de literatuurlijst. Dat wil dus zeggen dat de Key concepts niet doorzocht worden in de Basic Search, en dat is geen goede zaak 😦 : daar staan immers de kernwoorden van het artikel in! Positief is wel dat het in alle gevallen als een phrase wordt herkend, of het moet toeval zijn bij deze zoekactie.
In deze jaren komt ‘motion-induced sickness’ niet voor, wel als ik de jaren uitbreid. Dan vind ik er 4, waarvan 2 unieke, en die twee zijn wel relevant. Een van de twee heeft geen verbindingsstreepje, de andere wel, maar wel of geen koppelteken is voor Ovid geen probleem.

Basic search alle drie: 172
Advances search: alle drie: 180

Picarta
Enkele of dubbele aanhalingstekens maakt niet uit, maar zonder krijg je wel een heleboel … ‘Motion-induced sickness’ kwam hier helemaal niet voor trouwens.

3 390
zoeken [of](alle woorden)“motion sickness”
2 390
zoeken [of](alle woorden)‘motion sickness’
1 56709
zoeken [of](alle woorden)motion sickness

Scopus:
Het gebruiken van enkele tekens is hetzelfde als het weglaten ervan: gebruik van dubbele aanhalingstekens maakt wel uit. Binnen een phrase kun je sowieso niet trunceren, als we al eerder gezien hebben, dus theoretisch zou je ‘Motion-induced sickness’ ook niet vinden, maar dit komt in Scopus niet voor zonder dat ‘Motion sickness’ zelf voorkomt.

3. TITLE-ABS-KEY(“motion sickness”) 2.855
2. TITLE-ABS-KEY(‘motion sickness’) 2.991
1. TITLE-ABS-KEY(‘motion sickness’) 2.991

Web of Science: SSCI, A&HCI 1945-2007
Hierbij hoor je ook dubbele aanhalingstekens te gebruiken. In WoS zoekt de Topic search op de combinatie van woorden in Titel, Keywords en Abstract. De niet als frase gevonden titels zijn meestal niet relevant, maar je vindt soms ook ‘motion-induced’ sickness’ en dat hoort er wel bij. Die heb je dus niet met de andere acties gevangen.

4. 71 Topic=(motion sickness) not Topic=(“motion sickness”) 71
3. 1610 Topic=(“motion sickness”)
2. 1681 Topic=(‘motion sickness’)
1. 1681 Topic=(motion sickness)

Pikant detail
Een van de ‘motion-induced sickness’ titels heeft wel ‘motion sickness’ als trefwoord. Scopus en Ovid PsycInfo herkennen dat wel, WoS niet, terwijl WoS wel zegt ook in de Keywords te zoeken: maar daar bedoelen ze dus niet de Subject headings mee! Het gaat om deze titel:

Author(s): ARWAS, S; ROLNICK, A; LUBOW, RE
Title: CONDITIONED TASTE-AVERSION IN HUMANS USING MOTION-INDUCED SICKNESS AS THE US
Source: BEHAVIOUR RESEARCH AND THERAPY, 27 (3): 295-301 1989
ISSN: 0005-7967

Conclusie:
Bij het ene systeem worden enkele en dubbele tekens als elkaars gelijke gezien, en bij het andere systeem worden enkele aanhalingstekens gelijk gesteld aan geen quootjes. Het wordt de gebruiker toch echt niet gemakkelijk gemaakt!

CIL2008: One Click Ahead

Laat een reactie achter

Gary Price, uitgever van een van de meest gelezen weblogs op ons terrein: ResourceShelf, heeft een lezing One Click Ahead: Best of Resource Shelf (woensdag 11:30 a.m. – 12:15 p.m.) samen met zijn collega van Docuticker Shirl Kennedy.

De snelheid en de hoeveelheid info die hij weet te verstouwen is indrukwekkend, en vooraf vreesde ik dat dat niet bij te houden is. Maar nu we Moqub vorig jaar hebben gelezen ben ik voorbereid: dit schreef ze toen over zijn praatje over social search engines, en dit was de presentatie van ‘One click ahead’ in 2007 😉 . Hun presentatie van dit jaar staat op http://www.tinyurl.com/55equg.

Keeping up with all the changes in our industry and staying one step ahead of our clients require solid strategies to deal with this challenge. Our expert shares his top tips and techniques from the search and search engine world to ensure you stay in step with the fast changing 2.0 online information world.

Er zijn nog steeds veel mensen die niet met RSS overweg kunnen, vandaar dat ze het beste van die twee verzamelen en via de mail sturen. Kun je je op abonneren

Searchpickr : Zo kom je bij allerlei zoekmachines via deze interface*
BoardReader.com / BoardTracker.com: aan te bevelen voor Competative intelligence

Shirl heeft een lijstje gemaakt van 15 insanely useful websites (onder die link staan niet allemaal dezelfde als hieronder trouwens)

  • AudioBooksForFree.com: valt niet te zeggen wat je er vindt. Veel kinderboeken ook
  • Buy It Later voegt button toe aan Amazon boeken en als die wijzigt krijg je een mededeling. Doet maar 1 ding, maar doet dat goed
  • Executive Planet: wiki voor mensen die veel reizen
  • gethuman: als je geen computerstem aan de telefoon wilt hebben maar een echt iemand. (We love technology but hate it now and then)
  • GPO Search — Internet Publications Only: Catalog US government publications kwam ook al voor bij de RSS sessie
  • CiteSeerX bestaat al heel lang. Zij hebben een Alpha versie 😉 en die ziet er veel beter uit. Citaties en full-text op het gebied van computer science. Deze is puur op algoritmen gebouwd, niet door mensen onderhouden. Ziet er goed uit, gratis
  • MetaCarta geosearch nieuws op basis van Google maps. Wel wat lastig te zien waar het verhaal vandaan komt. Phil Pradley is er ook positief over
  • MobileLeap (login rubble888 password: ) Deze laat hij twee weken staan, het je er interesse in, dan downloaden
  • INFOMINE : een van de beste webgidsen, de andere is Intute (wel 1200 sites), heel goed. Van Intute zijn ook de virtual trainging suites heel goed, ook de A-Z of services is aan te bevelen.
  • Lyric Wiki: wiki met allerlei liedjes.
  • Privacy rights clearinghouse geeft tips hoe je jezelf moeilijker vindbaar kunt maken
  • JaJah: telefoon andere kant hoeft geen Skype te hebben
  • OpenCRS network is heel goede site verwijst ook naar andere sites
  • The SearchSystem.net database met public records

Wat opvalt is dat je steeds meer database achtige zaken in een wiki ziet. Bij het zoeken naar informatie over mensen: het gebeurt nogal eens dat er (deels) verkeerde informatie staat bij de profielen tussen goede, pas daarmee op.

Ze zijn ongelooflijk productief met hun weblogs deze twee, maar deze sessie is wel een beetje saai. Kan misschien ook niet anders als je wat over verschillende websites wilt zeggen.
Daar komt bij dat de beamer heel slecht leesbaar is afgesteld, de wifi is nog steeds down (kan ik niet wegsneeken), en er geen telefoonontvangst is … hier neemt mijn geluksgevoel ook niet door toe 🙂 .

————

* Friedhelm Rumpt uit Hannover sprak ik nog en die gaf me nog een aardige tip: SRCHR: hum … check it out! Voor hem had ik nog een andere tip: SPUTTR, maar die is vandaag even down…

Er is met Ovid te praten!

2 Reacties

Naar aanleiding van opmerkingen over OvidSP heeft Ovid NL ons (mij en R. en D., twee zeer ervaren zoekers) uitgenodigd voor een bezoek aan hun kantoor in Amsterdam om via een internet sessie een gesprek te voeren met de ontwikkelaars in Amerika (er was een sneeuwstorm in New York). Het was een heel geanimeerde bijeenkomst, wij hadden echt het idee dat we met onze ideetjes, opmerkingen, problemen, klachten en suggesties bij ze terecht konden. En nu maar hopen dat het een vervolg zal hebben.

Ikzelf had in mijn blog al gemopperd over de Basic search en het zoeken in de natuurlijke taal. In de loop van de afgelopen maanden heb ik veel bijgeleerd over hoe het in zijn werk gaat, heeft Ovid sommige zaken al wel wat aangepast, en er staan er nog meer op de rol voor de komende oplevering in april. Maar er blijft nog heel wat over waar we niet blij mee zijn, of die we liever anders zouden zien. Een aantal besproken items:

Zoeken

De standaard wildcard van Ovid is het $-teken, en dat is een teken waar niet veel mensen aan denken. Sinds kort kun je de * ook gebruiken, en dat is heel plezierig. Maar: dit werkt niet bij de auteurs, en dat is buitengewoon vervelend!

Het zoeken naar auteurs als zodanig is eigenlijk te lastig voor niet ervaren gebruikers: zeker als je geen voorletter weet is het niet meteen duidelijk dat je moet trunceren, en hoe dat te doen. Type je een achternaam in zonder iets, dan vind je of niets, of records die eigenlijk een fout bevatten. Wij vinden eigenlijk dat er een automatische rechtstruncatie moet komen, zeker wanneer je geen voorletters invult.

Silverplatter biedt de mogelijkheid ‘op’ een zoekactie te gaan staan en op ‘retype’ te klikken: je krijgt dan de zoekactie weer in je zoekbalk, en kunt die aanpassen. Afhankelijk van je computer instellingen kun je die zoekactie nu ook weer in je balk terugvinden en aanpassen, maar voor degenen die dat niet kunnen is zo’n ‘retype’ handig.

Voor de ‘Basic search’ is het zeer gewenst dat er een limiet komt op 5 sterren.

Het ‘word bag‘ probleem (zoekacties zonder tussenwoordjes zoals bij : ‘decision making library’ / ‘library decision making’) is een belangrijk onderwerp voor verbetering. Veel mensen zijn gewend in Google zomaar wat in te tikken, zonder daar meteen een juiste taalkundige syntax in aan te brengen. Verwacht wordt dat dat in de april versie opgelost zal zijn. Tot die tijd is de aanbeveling om wel gebruik te maken van het verbindingsstreepje, in tegenstelling tot wat Ovid standaard aanbeveelt (nl om dat vooral niet te doen). Voor onze cursussen zijn we daar niet blij mee: nu iets aanleren en over een maandje afleren: dat gaat niet werken. Maar dit is dus advies: gebruik tijdelijk constructies als ‘evidence-based’ of ‘decision-making’ met streepjes.

Zoekacties bewaren

Het is wel mogelijk een zoekactie te bewaren, maar alleen onder je eigen personal account. Als je uitlogt uit dat account, sluit je meteen Ovid af: het is dus niet mogelijk om een zoekactie te bewaren onder meerdere personal accounts. Daar wij voor onze klanten vaak een zoekactie doen waar ze zelf verder mee willen, zou dat wel handig zijn: 1x voor jezelf, 1x voor de klant. Je kunt dat wel als ‘ Expert search’ doen, maar dat vinden we niet altijd voldoende.
Het is nu ook niet mogelijk om een zoekactie te downloaden en elders te uploaden, zonder er erg veel werk aan te hebben. Noch is het mogelijk om een jumpstart buiten je IP range om te sturen, en eigenlijk is dat niet terecht. Wanneer je immers toegang hebt tot een bepaalde database, is er niets op tegen om een zoekactie van een persoon uit een ander instituut / met een ander IP adres, over te nemen. Die zoekactie is immers gerelateerd aan de database, niet aan de persoon.

Een andere actie die we graag zouden zien is dat aan de laatste hit van een ‘gesavede’ zoekactie een melding komt, zodat je, wanneer je een zoekactie opbouwt uit meerdere bewaarde onderdelen, meteen kunt zien welk onderdeel waar vandaan komt. Stel dat je zoekactie bestaat uit 4 hits, dan zou de 5e een ‘nep-hit’ kunnen zijn met als melding: ‘This is the <name of the search> search executed’ of zoiets . Dat moet niet zou moeilijk zijn: Silverplatter kan dat al.

Voor ‘expert users’ zouden we ook graag de mogelijkheid zien om een bewaarde zoekactie te kunnen bewerken in een ‘notepad’ omgeving: zodat je met knippen-en-plakken snel een zoekactie kunt samenstellen zonder dat regel voor regel te hoeven doen. Dat zou voor degenen die echt weten wat ze doen veel tijd kunnen schelen 😉 . Dus naast de regel-voor-regel optie.

Display:

De term ‘Syntax search’ is vervangen door ‘Ovid Advanced Search’ De naam Ovid moet erbij, omdat straks de ‘SilverePlatter Advanced Search’ er ook bijkomt.

Het is mogelijk een aantal aanpassingen doen op je scherm: bij ‘Customize display’ welke velden je wilt laten zien, en aan de rechterkant van de balk het aantal records op een pagina, maar eigenlijk is het aantal titels dat je op een enkel scherm tegelijk kunt tonen wat te weinig. Er zit wel erg veel ruimte tussen de records onderling, ligt ook deels aan de link-opties aan de rechterkant: die nemen wel erg veel ruimte.

oviddisplay.jpg

Het heen en weer springen van het scherm als je van het ene scherm naar het andere gaat is hinderlijk: dat is opgelost bij de volgende oplevering.

Waarom staat er eigenlijk bij de zoekbalk: ‘Enter keyword or phrase’?ovidkeyword.jpgWanneer je namelijk de ‘mapping’ hebt gedaan, staat er onderaan nog eens je term met ‘ search as keyword’: ovidkeyword1.jpg
Hier wordt ‘keyword’ dus in twee verschillende betekenissen gebruikt en dat schept verwarring. We stellen voor om bij de zoekbalk te zetten: ‘ Enter word or phrase’ .

De display van de resultaten van de ‘Basic search’ geeft nu aanleiding tot verkeerde veronderstellingen, omdat ze gepresenteerd worden op dezelfde manier als die van de ‘Advanced search’. We stellen voor om de resultaten meer grafisch weer te geven: als je een zoekactie hebt van 2000 hits, waarvan er maar 4 relevant zijn (=5 sterren), zou je dat beter in een grafiek kunnen tonen, dan met concrete getallen op de manier zoals nu gebruikelijk is, zodat je in een oogopslag kunt zien dat het merendeel minder dan 50% relevant is, of hoe het resultaat dan ook mag zijn.

In tegenstelling tot de ‘Advanced search’ is het niet gewenst dat een zoekresultaat gebruikt wordt in combinaties, tenzij in een ‘NOT’ combinatie met een zoekresultaat uit de ‘Advanced search’ (als aanvulling bijvoorbeeld). Dus het helemaal afvangen van de mogelijkheid tot combineren is zeker niet gewenst, maar het inperken daarvan wel.

Nabranders (antwoord volgt)

  • 200 records in een keer max kunnen downloaden is veel te weinig, dat aantal moet fors omhoog.
  • Waar kun je instellen dat je gebruikers automatisch op de ‘Advanced search’ binnen komen? We hebben het niet gevonden.

We hadden volop gespreksstof. Ik vond het een heel zinnige middag, het was erg prettig om met een paar collega’s over dit soort onderwerpen te praten, en ik had echt wel het idee dat Ovid wilde luisteren. Zouden we vaker moeten doen …