Gastblogpost door Sandra Wullms:
VOGIN-IP Lezing: Zoeken en vinden 2014 (20 maart 2014, Amsterdam)
Het complete programma van deze dag is hier te vinden.
Als eerste heb ik de workshop gevolgd van: Marydee Ojala Web search update: What’s new that effects Information Professionals
Achtergrond info Marydee Ojala:
Marydee Ojala is de redacteur van Online Searcher (successor of the magazines Online + Searcher) en schrijft hierin de business research column (“The Dollar Sign”).
Over haar presentatie: “Reflections on the reinvention of research”
Online informatie is er nu al ruim 40 jaar. Het waren vier decennia van opwindende en nieuwe ontwikkelingen die onderzoek hebben getransformeerd, de mentaliteit van bibliothecarissen/esses veranderd, de verbeelding van de mensen hebben geprikkeld en toegang hebben gegeven tot informatie die voorheen niet toegankelijk was. Deze workshop inzicht geven in de aard van zoeken op het web in tegenstelling tot traditionele online zoeken, onderzoeken wanneer te kiezen voor een betaalde database t.o.v. gratis zoekactie op het web, en kijken naar de nieuwste ontwikkelingen van online onderzoek.
Hieronder enkele korte notities en tips uit haar workshop.
Websearches worden beïnvloed door het land van waaruit je zoekt.
Het beperkt zich ook niet meer alleen tot HTML, maar ook afbeeldingen, video’s, PDF’s etc. worden in de zoekresultaten meegenomen.
Van zoekacties uitgesloten zijn:
- het zgn. invisible of deep Web
- Editorially blocked (Robots.txt, files die aangeven in hoeverre een site door zoekmachines doorzocht mogen worden)
- Proprietary data (data die niet vrij toegankelijk zijn, maar eigendom zijn van iets/iemand)
Hoe kun je je zoekresultaten beïnvloeden?
- Verander de voorkeuren/preferences (bv. de taal)
- Gebruik andere zoekmachines, bv. Millionshort.com
- Site search (zoeken binnen een site):
- Gebruik google om binnen een site te zoeken. Geef de zoekterm in met daarachter [site], bv. crash tests [tno.nl]
- Advanced search
Verschillende typen zoekmachines:
algemene en computational (geeft feiten/data en geen links), alternatieve zoek machines (w.o. scholarly)
Algemene
- Google (Google is niet beschikbaar in Rusland, Japan, Zuid-Korea en China. Google reageert op veranderingen in je locatie en op sociaal- en persoonlijk-gebied).
http://www.google.com/ncr Een alternatief web adres voor Google.com dat ervoor zorgt dat je altijd op .com terecht komt zonder redirecting
- Landen versies (minder dan Google)
- Meer sub-sites listings
- In corporate IE-10
- Connecties met FB/Social Media (zoekt hierin en neemt dit op in de resultaten)
- Beschikbaar op de X-Box (game computer).
- Kaarten in Bing zijn soms beter
- Niet geïnteresseerd in tracking van persoonlijk info
- Om klant georiënteerde resultaten te krijgen moet je erom vragen! Blekko geeft dus (in tegenstelling tot Google) ongefilterde resultaten. Om meer te weten te komen over de standpunten van de liberalen en/of e conservatieven mbt de gezondheidszorg in America zul je dit dus aan moeten geven: Health politics liberal of Health politics conservatives.
- Gaan voor kwaliteit niet kwantiteit!
- Laten zoekresultaten zien gegroepeerd naar bepaalde thema’s. Bijvoorbeeld bij de gebeurtenis Tyfoon op de Philippijnen krijg je info te zien in blokken: News, info, video, etc.
- Search.blekko.com : Doorzoeken van Blekko kan met “slashtags”, dit is meer voor info pro’s (en zijn dus oorspronkelijk ook samengesteld door bibliothecarissen).
- Geen “bubble” (zoekresultaten worden niet opgeslagen, geen tracking).
- Gebruik exponentieel gegroeid sinds NSA’s Snowden affaire. DuckDuckGo verkoopt hun informatie niet aan de overheid.
- Je kunt met Google zoeken via DDG, je zou dan anoniem zoeken.
- Investeerder in Blekko
- Hoofdkantoor in Rusland/Nederland/vertegenwoordigd in USA (eigenaar Russisch).
- Yandex heeft “labs”, een vergelijkbare feature Google had om nieuwe tools te ontwikkelen.
Computational: Wolfram Alpha, Zanran (zoekmachine voor het zoeken van data/statitieken op het web).
Alternatieve platvormen om te zoeken w.o. Scholar platvormen:
Medisch: Pubmed, Patientslikeme.com
Overheid: De trend binnen de overheid is om steeds meer “open” te gaan. Worldbank.org, UN.org (Verenigde Naties).
Voorwerpen/afbeeldingen zoeken:
- Tineye.com: zoeken op afbeelding voor als je bv. niet weet wat er afgebeeld wordt, wat iets is.
- Bing image database: afbeeldingen filteren die ondersteund worden door creative comons licenses.
Tweets
- Topsy: gearchiveerde tweets
LinkedIn : Heeft een nieuwe privacy policy, er schijnt samenwerking te zijn met zoekmachines.
Domaintools.com: zoeken naar de eigenaar van een site
Advanced search
Google had voorheen de mogelijkheid om een advanced search te doen. Deze mogelijkheid is er nog steeds maar zit nu een beetje verstopt: google.nl/advanced_search of klik na een zoekactie op de google pagina op het gear/instellingen wieltje.
Let er ook op om bij advanced search “betere” vragen te stellen. Door je trefwoorden in een andere volgorde in te geven krijg je ook andere zoekresultaten en kan het verschil zijn tussen wel en niet vinden wat je zoekt.
Syntax search werkt nog steeds bij Google (AND, OR, NOT)
- Proximity searching (zoeken naar/met woorden die binnen een bepaalde afstand van elkaar staan):
- Google’s AROUND commando werkt niet of niet goed, je kunt bij Google gebruik maken van proximity search door de woorden tussen haakjes () te zetten.
- Exalead’s (zoekmachine) NEAR commando werkt beter. Exalead heeft een lab: Chromtik (zoeken op kleur)
- Voxalead (zoeken op stem)
- “Exact zoeken” (alles tussen aanhalingstekens plaatsen).
- Let ook op het gebruik van cijfers in een zoekactie. 2 of Twee in de zoekactie leidt tot verschillende resultaten! Handiger is om ze beiden in de zoekactie te gebruiken.
- Probeer de zgn. “filter bubble” te vermijden: zet je zoekgeschiedenis uit, en let op je voorkeursinstellingen (taal, land, etc.).
Nieuwste ontwikkelingen bij Google:
- Voice search (engels)
- Zoeken naar kennis, niet alleen naar documenten
- Advanced search heeft geen prominente plaats meer
- Veranderingen m.b.t. maps/streetview (waarvan men ook weer een groot aantal heeft terug gedraaid i.v.m. de storm aan commentaar/kritiek).
- Zoeken op patenten (incl. tekeningen).
- Indexeren van publieke data (bv. (open) data van overheid)
- Google probeert ook de zoekresultaten te verbeteren door bv. advertenties meer op de laten vallen (deze staan vaak boven de zoekresultaten en werden vaak niet als dusdanig herkend. Vandaar dat men nu de tekst box ADD bij deze advertenties een opvallend geel kleurtje heeft gegeven).
Kennis initiatieven:
- Inhoudelijk diepgaande artikelen (gebruikt niet de nieuwste/recente info).
- Infographs (gebruikt o.a. Wikipedia).
- Science : Open Access: enorm in opmars. Ook problemen met “nep” artikelen (Sting door John Bohanon; DOAJ keurde dit artikel goed)
- Crowdsourcing Science: Wetenschap gebruikt niet wetenschappers om een bijdrage te leveren aan de wetenschap, bv. bij het identificeren van sterren.
Al met al een interessante lezing/workshop waar natuurlijk e.e.a. voorbij kwam wat de meeste van ons al weten, toch waren er ook veel leuke en interessante tips bij die wellicht nog van pas kunnen komen bij onze dagelijkse werkzaamheden. Van deze lezing is de getoonde PTT helaas niet beschikbaar.
Middagprogramma
- Marydee Ojala – Refections on the reinvention of research
- Prof. Dr. Maarten de Rijke – De autonome zoekmachine
- Antoine Isaac – Semantic Web, Linked Data: the Europeana case(s)
- Robert Jan Alting von Geusau – Enterprise search bij AkzoNobel
- Arno Reuser – Wat bedoelde u eigenlijk? Problemen rond de analyse van inlichtingenproducenten en de rol van informatie-professionals daarin
Voor het middagprogramma verwijs ik (ook) graag naar de presentaties: Link naar de PPT’s
- Presentatie Marydee Ojala – Reflections on the reinvention of research
Online is niet hetzelfde als het internet (www)! Online was er vóór het web.
Verleden:
Zoeken door professionals voor de komst van het internet.
Gisteren:
- We (Info Pro’s) waren magiërs, klanten vroegen ons om alsjeblieft te vinden wat ze nodig hadden!
- Niets was gratis (online databases).
Fundamentele veranderingen:
- Personal Computing: PC’s
- Zoeken verhuisd van mainframe’s naar desktop
- Verwachtingen zijn gestegen
- Formaten (bestandsformaten) zijn uitgebreid
- Internet is een gemeengoed geworden
Vandaag:
- Men verwacht dat de informatie vrij is
- Snelle veranderingen
- Self-Service
- The filter bubble / Eli Pariser (TED-Talk!)
Het Web doorzoeken
- Niet alleen onderwijzen in information literacy maar ook in (trans)media literacy(video/geluid)
- Alles wordt gedigitaliseerd, wat doen we ermee?
- Dark Corners/Dark web (illegaal internet etc.)
Betaald zoeken: De verschuiving vindt plaats van betaald naar gratis:
- Traditionele verkopers krijgen het moeilijk
- Nieuwe platforms gebaseerd op Open Source
- O.A.
Online morgen
- Wearable technology
- Augmented reality
- Voorspellende analyses (de antwoorden ontstaan voor de vraag gesteld is)
- Gesture technology (interpreteren van menselijk gedrag d.m.v. algoritmes) , post literature world?
- Atomization of information (Wat is een boek/tijdschrift; formaten veranderen: de pagina in een e-boek is anders dan in gedrukte vorm.)
- Kunstmatige intelligentie (Internet of things, je koelkast stuurt boodschappen lijstje naar leverancier)
- Mobiele apparaten
- Gesproken zoekacties
Wat is de toekomst van InfoPro’s en hun werkveld?:
- Opnieuw uitvinden van onderzoek/zoeken
- Wat verwachten/willen we van onze verkopers/leveranciers?
- Vertrouwen: echt of nep (peer-reviewed!)
Een leuke presentatie met natuurlijk een groot gedeelte overlap met de workshop in de ochtend.
- Presentatie Maarten de Rijke – Autonome zoekmachine
Onderzoek naar het “ranken” van resultaten (algoritmes om de resultaten te ranken)
- Inhoud
- Structuur : Documen / Link structuur / Sociaal
- Gedrag : interactieve data (Klik gedrag, doorklikken), impliciet vs expliciet
- Synthese van rankers: samenvoegen van rankers, wat moet waar getoond worden.
- Evaluatie rankers: offline verzamelen van queries, gebruiksstudie, online.
Ontwikkeling ranking: van supervised naar unsupervised (zelf lerende systemen).
Geen eenvoudige kost tijdens de presentatie. Ontwikkeling van algoritmes naar zelf-lerende/regulerende algoritmes zoals die bv. ook achter de zoekmachines draaien. Wel een zeer interessant thema aangezien we hier in de toekomst steeds meer mee te maken krijgen (denk hierbij ook aan alle ontwikkelingen rondom Big Data).
- Presentatie Antoine Isaac – Europeana en het Semantische Web
- Europeana krijgt “meta-data” aangeleverd, niet de objecten zelf. Europeana is eigenlijk een distributiekanaal.
- Men verzameld info van verschillende bronnen en legt verbanden (semantic).
- Europeana en partners leveren open meta-data.
Europeana is een enorm project voor het borgen van het cultureel erfgoed in Europa. Hierbij wordt in feite deels ook gebruik gemaakt van Crowdfunding aangezien iedereen materiaal en info aan kan leveren bij dit project. Uitdaging is om ervoor te zorgen dat alles gestructureerd aangeboden wordt. Hierbij zijn alle verschillende talen binnen Europa een factor die het nog complexer maakt. Daarnaast heeft men ervoor gekozen om het project gefaseerd uit te rollen. Langzaam wordt alles (steeds complexer) opgebouwd. Een strategie die nu zijn vruchten begint af te werpen.
- Presentatie Robert-Jan Alting van Geusau (AkzoNobel) – Implementation of a Central Intelligence Web
Intelligence is binnen de Corporate Strategy ondergebracht als staf functie.
– Welke info is waar nodig?
– Hoe krijgen we de info daar?
Inventarisatie
– Wat wordt waar gekocht?
– Centraliseren
– Uitsturen van alerts werd vaak dubbel gedaan (dus centraliseren en ontdubbelen)
Multidisciplinair team
– Juristen
– Communicatie
– Researchtakken
– IP-ers
Company visits gedaan (ontdekken van best practises)
Presentatie van leveranciers (o.a. Comintelli) van Intelligence Systems, hieruit werden er 2 geselecteerd.
– Klein beginnen met mogelijkheid tot uitbreiding/groei.
– Uiteindelijke keuze: geen grote leverancier, klein, geen core speler, maar meer mogelijk m.b.t. maatwerk.
– Implementatie
– One Intelligence
Inrichting achter Firewall.
Providers om medewerking gevraagd bij inlezen van info (LexisNexis, Dow Jones etc.).
Newsfeeds genereren verliep niet geruisloos.
Er zijn verschillende views voor verschillende takken/researchgroepen, toegespitst op de wensen van de betreffende groep.
Implementatie:
– Presentatie aan management
– SSO (Single Sign On) access, dus geen PW
– Besparing door centrale inkoop en centraal beschikbaar stellen
Gebruikers genereren informatie, er wordt automatisch geclassificeerd.
Cruciaal: IT & risico analyse vóór een upgrade!
Software runnen op parallelle server gedurende de update.
Basis van het systeem is een taxonomie (3 niveau’s) die verder uitgesplitst wordt naar een taxonomie per tak/bedrijfsonderdeel.
Een erg interessante presentatie! Je zou hier nog wat info vandaan kunnen halen m.b.t. het centraal stroomlijnen van informatie!
- Arno Reuser – Wat bedoelde u eigenlijk? Problemen rond de analyse van inlichtingenproducenten en de rol van informatie-professionals daarin
Een lichte en luchtige presentatie ter afsluiting van deze VOGIN-IP dag. In deze presentatie kwamen meerdere hilarische voorbeelden voorbij rondom het verkeerd interpreteren van informatie met alle gevolgen van dien. Reuser gaf ook nog een “pep”-talk m.b.t. de kennis en kunde van “ons” als informatieprofessionals: we hebben kennis en we kunnen veel, dus niet altijd zo bescheiden zijn….
Al met al een interessante, leuke en leerzame dag!
http://vogin-ip-lezing.net/
Vind ik leuk:
Like Laden...