Google Enterprise Search #KBenP11

Enterprise Search
Verzorgd door Google
Niek Snel (Head of Enterprise Search Benelux & Nordics at Google)

Iedereen weet precies hoe hij/zij op internet moet zoeken om datgene te vinden wat men zoekt, zonder daarin getraind te zijn. En men is vaak in staat om binnen een aantal seconden daadwerkelijk datgene te vinden wat men zoekt. Is het niet vreemd dat we op kantoor vaak nog uren besteden aan het vinden van wat we hopen dat je juiste informatie is? En dat we dan ook nog meerdere zoekopdrachten moeten uitvoeren in verschillende silo’s van informatie? De Google Search Appliance biedt werknemers de mogelijkheid om op eenvoudige en efficiënte wijze de meest relevante informatie te vinden en en stelt ondernemingen in staat om op korte termijn zeer veel geld te besparen. De 3 belangrijkste aandachtsgebieden hierbij zijn: eindgebruiker, security en eenvoud!

85% van de gebruikers heeft weleens wat online gezet. Internet is onderdeel van ons dagelijks leven gaan uitmaken. Consumerisation of IT ; thuis gaat t beter dan op t werk eigenlijk.

Iedereen kan zonder training met google zoeken, met enterprise zoeken heb je vaak t gevoel dat je verdrinkt in de informatie en toch niet kan vinden wat je zoekt. Allerlei info staat in diverse silo’s: je moet eigenlijk al weten wat je zoekt. Kenniswerkers zijn een kwart van hun tijd bezig met zoeken.

80% ongestructureerde data, 20% gestructureerd, en met name de ongestructureerde data groeit enorm. De impact op de productiviteit is enorm,

3 pijlers van Google’s enterprise search:

  1. gebruiker centraal
  2. security toegeapst, alleen vinden waar je bij mag
  3. elegante manier eenvoudig

Belangrijkste bronnen :  CMS, intranetten, sharesd files, databases, enterprise applications. en daarop een zoekfunctie die in alles zoekt met op basis van relevantie gesorteerde resultaten.
Relevantie is de belangrijkste insteek van Google. Dat kan ook op enterprise toegepast worden.
Self learning scorer: naarmate hij meer gebruikt wordt wordt t resultaat beter.

User centered

  • Relevantie kan ook afhangen van wie je bent, waar je voor werkt.  Als je werkt voor marketing kan een resultaat vanuit sales belangrijker zijn dan vanuit engineering bijv. Of op basis van taal of locatie.
  • Snelheid is ook van belang; 3,7 seconden geven mensen gemiddeld de tijd voor ze wat anders gaan doen.
  • Zoeken in verschillende talen: daar is veel vraag naar.
  • Presentatie van de informatie op een google manier want daar zijn mensen aan gewend.
  • Geïntegreerd in het eigen portaal: zodat de gebruiker niet naar een aparte omgeving moet
  • Als bedrijf kun je wel enigszins de relevantie zelf te beïnvloeden
  • Page ranking heb je niet, dus dan moet het van andere zaken afhangen
  • Evt kun je een app laten schrijven om je documenten te laten  waarderen met sterren en die mee te laten tellen met relevantie
  • Alerts kun je instellen

Security.
Op basis van wat mensen mogen zien door direct te communiceren met bestaande standaarden. Ligt dus ook aan hoe het nu geregeld is.
Single sign-on., LDAP, ze integreren met die standaarden. Meestal hebben bedrijven dat goed geregeld, daar gaan ze niet zelf iets aan regelen. Enterprise zit achter firewall er is geen contact met de buitenwerld. Bedrijven maken soms een apart kanaal naar buiten voor anderen, maar daar wil Google zich niet in mengen.

Simplicity
Hoeft niet simpel te zijn, maar moet simpel ogen.  All in one solution. simpel licensing model; hoeveelheid documenten ie je zou willen indexeren. (telt in miljoenen).
Eenvoudig om te beginnen: en geavanceerde configuratie mogelijk. Ze werken vaak met KBenP samen daarvoor.  Meestal in fases;

  • Fase 1 = out of the box: bronnen die belangrijk zijn en veel autoriteit hebben (Sharepoint bijv)
  • Fase 2 look en feel aanpassen, finetunen, andere bronnen  toevoegen

Google commerce search
S
inds vorige maand ook in Nederland ; zoeken in  webshops

vraag: kun je in enterprise wat doen met +1.
antwoord ja, maar gaat niet heel actief onderdeel worden, hoort meer in de cloud

vraag: tellen resultaten van je eigen desktop mee
antwoord ja. ook je mail

~~~moetne we toch gewoon hebben! ~~

By Dymphie Posted in Zoeken

Watching search #KBenP11

The Big Apple – update van de Enterprise Search Summit te New York 
verzorgd door EMID, Certified Search Professionals voor Autonomy, Exalead en Google.
Edwin Stauthamer en Ronald Baan, Adviser Search & Collaboration Emid Consult B.V.

Op 10 en 11 mei was in het Hilton hotel in New York de Enterprise Search Summit. Deze Summit veschafte veel inzicht in de  trends op het gebied van enterprise search en de punten waar iedereen mee worstelt. Enterprise search expert Ronald Baan deelt de bevindingen met u, heet van de naald. Deze bijdrage gaat minder over de technologie en veel meer over hoe je enterprise search binnen de organisatie uitbouwt, wat wel en wat niet goed werkt. .

Ook hier weer volle bak: alle stoelen bezet, staplaatsen.
Eric Sieverts zit de sessie over Zoeken voor.

———–

EMID zijn onafhankelijke adviseurs, Autonomy en Exalead vertegenwoordiging.

Thema’s ; Governance -> implementation ->bull’s eyfe from  content + users + technology
Eindelijk wordt de gebruiker dus belangrijker.
Goede implementatie is van belang net  als beheer ,  visie en onderhoud (governance).

Google’s web search zet de standaard: Mensen zijn gewend met google te werken:  zij doen het goed en men verwacht dat ook binnen bedrijf. andere zoekmachines gaan daar ook op lijken.
Wat is aantrekkelijk in google:

  • eenvoudig zoekbox
  • tips en tricks
  • vergelijkbare documenten samenvatten
  • wisdom of the crowd gebruiken

Verschik websearch en enterprise search

  • filteren security regels
  • unieke site
  • eigenaren van docs geven geen goede metadata, op t net vaak wel
  • domeinspecifieke metadata vaak van slechte kwaliteit
  • veel verschillende m niet vergelijkbare informatie
  • Positief; we weten rol medewerker, dus zouden die info kunnen gebruiken
  • Informtie over afdelinen en zo vaak ook aanweig

Use cases

  • known item search
  • learning (nieuwe medewerkers, nieuw onderwerp) exploring
  • parametric (mensen die wetne hoe info gestructureerd is en die door willen klikken in menustructyuyr
  • experts ; uitgebreide zoektechnieken, domeinkennis

Soortn enterprise omgevingen

  • enterprise search ; alle bronnen voor alle medewerkers
  • intranet search (bv CMS)
  • metadata search (bibliotheeksysteen) veldzoeken
  • vertical search (contct center)

Kenniswerker verwacht meer
enterprise search zich aan t ontwikkelen

Search engines are the cyberspace receptionists

  • dialoog interactie met gebruiker
  • duidelijke terugkoppeling (waarin je iets heb t gevonden)
  • context en social (gebruik context van gebruiker)
  • ‘psychic’search zoeksysteem weet wat gebruiker bedoelt

content:

  • intenre metadata
  • externe informatie
  • entiteiten

Psychic: kijken nwaar veel op gezocht wordt en at gebruiken om die info in te lezen en beschikbaar te stellen

helder en simpel: gebruik standaarden: als het overal zo gebeurt, maak er gebruik van, men kent dat,hoe altijd doel of de geest van de taak in het oog. Hou in de gatne waar je naar toe wil.

eigenaar vn de zoekomgeving verwacht meer

  • beher tools: grafisch
  • meer mogelijkheden; continue kleine verbeteringen
  • makkelijker aan te passen

Content anaalyse:

  • 80% ongestructureerd
  • hoeveel vheid data en info neemt toe
  • verattivio, Coveo, Dieselprint, IBM, open text
  • vuiling
  • clean, clean, clean:
  • garbage in, garbage out

Zoekmachine wijst je op de kwaliteit van je content!

metadata en  zoekfuncties facetted search

Voordelen

  • conversational
  • voorkomen 0 hits
  • code gelijk aan geavanceerde systemen

Ontleen facetten aan: taxonomie, entity extraction (als je gene taconomie hebt, haal onderwerpen uit je content, zelfstandige naamwoorden bv), classification, metadata
Manier waarop folders zijn gestructureerd kun je ook gebruiken.

ongestructureerde data: doe iets! De gebruiker zit niet te wachten op een bak ongestructutureerde hits.  entity erxtraction bv

Producten

  • Bekendste: Autonomy, Endeca, Exalead, gogle, FAST
  • Tweede laag: (nieuwkomers)
  • verticl venors: specifieke markten

totale zoekoplossing?
Wil je wel alles wat kan? Denk na over wat je eigenlijk zou willen.
Geheim van een goede zoekoplossing = betrokkenheid van de medewerkers.
Lange termijn.
Betrokkenheid corp communicatie, search experts erbij betrokken, it moet t kunnen beheren.

Toekomst

  • Googe effects (false simplicity)
  • focus on user tasks vqnd user interfacers
  • search based applications search driven appkications
  • semantic techniued  become more mature
  • more personal context, social search, search history
  • SAAS faster time to market

Quorte:

Martin White — tells us that the fire of progress is lit by inspiration, fuelled by information, and sustained by hope and hard work

By Dymphie Posted in Zoeken

Nexis : verslag van een demonstratie

Nexis is het vlaggenschip van LexisNexis

LexixNexis is een vooraanstaande leverancier van op kennis en informatie gebaseerde oplossingen voor professionals in verschillende sectoren, zoals de zakelijke markt, juridische markt, overheid, hogescholen en universiteiten en risicobeoordeling (compliance).

Nexis bevat Nieuws (dagbladen, kranten, weekbladen), Bedrijfsinformatie en Marktinformatie.
Als je op de link klikt van NexisNL krijg je de Duitse versie: dat komt omdat zowel Deutsch als Dutch met een D begint zeiden ze me, maar dat wordt aangepast en bij de volgende oplevering van de software is dat eruit.
In verband met copyright wordt wel de tekst van de krantenartikelen opgeladen, maar niet de foto’s: daar gelden weer andere regelingen voor.
Ook free-lancers die voor een krant werken hebben vaak afzonderlijke regelingen en vallen niet altijd onder de beschikbare informatie in Nexis.
Publisher: De gegevens uit Nexis mag je in verband met copyright niet op je intranet plaatsen, die uit publisher -apart abonnement- wel.  Dan krijg je ook de artikelen als PDF: inclusief foto’s.
Media coverage analyser
is een product van LexisNexis,  maar helaas is op de site niet meteen de brochure te vinden die ik hier wel heb  (da’s niet zo handig van ze) ;-) .  Je kunt dat gebruiken om mooie tabellen en grafische informatie over je bedrijfscommunicatie te krijgen. Evt in combinatie met publisher.  De kosten hiervoor zijn 750/mnd voor beperkte zoekactie, oplopend tot 1500.

Als je problemen hebt met zoeken of vinden van de juiste info:  er is een  Service desk en die kun je vragen om hulp bij zoeken.

Nieuws
Landelijke dagbladen worden ‘s nachts opgeladen, om zo snel mogelijk beschikbaar te zijn.  Het buitenlandse nieuws (engels) wordt automatisch geïndexeerd, het Nederlandse nog niet helemaal. Geindexeerde informatie is -ook- via een thesaurus doorzoekbaar.

Er is een algemeen Zoekformulier op de beginpagina en een Nieuwszoekformulier na een klik. In deze laatste zitten  iets meer opties:  het is gesteund zoeken met uitklapmenuutjes voor de meest voorkomende velden en al ingevulde operatoren.  De term :  ‘Min 3x ‘  slaat op het aantal keer  dat een zoekterm wordt genoemd in een artikel.

Zoeken
Paar bijzonderheden:

  • Koppelteken  wel of niet gebruiken maakt niet uit
  • 2 termen achter elkaar moeten ook in die volgorde voorkomen
  • geen vaste volgorde: w/5 is binnen 5 woorden voorbeeld:  (term1 w/5 term2)
  • wel vaste volgorde, term 1 voor term 2: Pre/5 binnen 5 woorden.
  • ! is truncatie teken: staat voor onbeperkt aantal letters. Advies: altijd trunceren in Nederlandse zoekacties
  • Atleast2(term) ; de Term moet tenminste 2x voorkomen
  • je kunt  ook op lengte van de artikelen zoeken
  • operatoren hoeven niet met hoofdletters
  • je kunt trouwens wel (actief) zoeken op hoofdletters

“Voeg toe”: met deze optie kun je een dossier opbouwen, deze items blijven 24 uur staan, vgl ‘MyList’ in Scopus.

Vraag over de periode: periode is dat ‘tot’ of ‘tot en met’? (Er staat ‘tot’  in het pull-down menu, maar volgens mij zoekt-ie ‘tot en met’ ).  Ze kijken het na.

Kosten
Nexis is een dure database. Je kunt de kosten afkopen voor een vast bedrag: dan heb je een soort flat fee, waarvan het gebruik wel wordt bijgehouden: incidenteel eroverheen gaan is niet erg, maar als dat vaak gebeurd word je aan je jasje getrokken. Voor de gebruiker is het wel tamelijk weinig inzichtelijk hoe het er met je gebruik voorstaat:  daar schijnt een optie voor te zijn die al dan niet aangezet kan worden.
Je kunt  ook Pay-as-you-go werken; dan betaal je voor wat je doet.
Indicatie: 1 artikel = 2,75.

Berekend wordt de zoekactie zelf en de downloads (=printen of saven).  Tonen van een full-text op het scherm is gratis.
Als je een zoekactie gedaan hebt, kun je die zonder kosten inperken (verfijnen) . Advies is dan ook: neem een ruime zoekactie en een ruime datum periode en perk daarna in.
De hoogte van het verbruik hangt ook af van de gebruikte bronnen: je hebt een brongroep waar een apart tarief voor geldt: bijv alle Nederlandse kranten samen. Je kunt ook op afzonderlijke kranten zoeken, maar een combinatie van een paar kranten is al snel duurder dan zoeken  op alle kranten tegelijk.
Advies is hier ook: kies voor de brongroep -in een ruime periode-  neem geen losse bronnen, en perk daarna eventueel in op afzonderlijke kranten, of verfijn op onderwerpen of op periode.
Printen van een uitgebreide lijst is net zo duur als van een enkel artikel full-text 2,75.

Resultaten groep
In een cluster links op het scherm worden de soort bronnen + de aantallen hits daarin getoond en daarop kun je sorteren.
Een zoekactie kun je ontdubbelen over diverse editie van een bron: een persbericht telt dan bijvoorbeeld ook maar eenmaal.
In de resultaten groep blijft het aantal niet-ontdubbelde hits staan, terwijl bovenaan het scherm het aantal wel ontdubbelde staat: ikzelf vind dat wat verwarrend.
Van de zoekset kun je-via verfijnen-  een subset maken, deze wordt ook niet geteld als zoekactie.
Het opbouwen en verfijnen van zoekacties na de initiële  moet je wel doen door gebruik maken van booleaanse operatoren in de  commandotaal, dan heb je niet de keuze voor een vooringevuld zoekformulier.

Attendering
Als je een zoekvraag regelmatig gebruikt kun je je laten attenderen op nieuwe hits: die komen dan in je e-mail. Een attendering is goedkoper dan elke keer een zoekactie doen omdat  de kosten anders liggen:  zijn afhankelijk  van de gekozen frequentie, (dagelijks/wezenlijk) plus de printkosten  (saven en downloaden) van documenten.
Een attendering zoekt wat er nieuw is bijgekomen vanaf de oorspronkelijke zoekactie: als je dus een maandelijkse alert wil van wat er die maand is binnengekomen, worden ook de items die retrospectief zijn toegevoegd -horen immers bij de set die die maand is toegevoegd- getoond. Netjes.

Engelstalig nieuws.
De algemene brongroep van alle engelstalige bronnen ‘All english language news’ is erg groot: dan krijg je ook allerlei kleinere Amerikaanse krantjes, die kun je uitselecteren door te kiezen voor  Major world publ (english).
De Engelstalige items worden automatisch geïndexeerd: er zit een uitgebreide thesaurus achter.  Via de optie  Indextermen krijg je dan op het algemene zoekscherm de ‘Broader terms’ .  Daar zitten natuurlijk veel specifiekere onder: de thesaurus kent een automatische Explode functie, daar hoef je niet om te vragen, maar je kunt hem ook niet uitzetten zo te zien.
Elk artikel krijgt een aantal termen, bij die termen wordt ook de mate van relevantie van die term voor dit artikel aangegeven. Die techniek is ontwikkeld door LexisNexis zelf.
Bij het zoeken kun je vragen om artikelen met hoge relevantie: dan gaan ze meer dan 85% over het onderwerp.
Je kunt Verfijnen door te klikken op een van de Narrower terms om het zoekresultaat in te perken: dat hoort nog tot dezelfde zoekactie.
Hoger in hiërarchie kun je gaan via een zoekactie in de Indextermen, dan krijg je blik in systeem en kun je ook bovenliggende termen vinden.  Dat is uiteraard een nieuwe zoekactie.
Een belangrijk deel van die Indextermen zijn namen van Bedrijven en Markten: als je een zoekactie in de thesaurustermen hebt gedaan kun je voor een van die opties kiezen.
Best indrukwekkend zo op ‘t eerste gezicht.

Nederlandse Bedrijfsinformatie
Denk bij het zoeken eraan om ook de naam met alternatieve spelling of  in meerdere woorden los van elkaar te gebruiken met OR relatie.
Je kunt ook zoeken op adres en telefoonnummer.
Het hangt van omvang van het bedrijf af wat er voor informatie beschikbaar is: wat er wordt geleverd zijn alle Kvk gegevens, aandeelhouders en de adresgegevens met een extra controle of toevoeging. De bestuurders staan er niet bij, maar die zijn wel te vinden via Dun & Bradstreet.
De database wordt  maandelijks geactualiseerd.

Internationale bedrijfsinformatie
Behalve de Nederlandse hebben ze ook bedrijfsinformatie voor verschillende andere landen afzonderlijk, en er is uiteraard een algemene bron die ze allemaal combineert. Een bron is bijv Dun & Bradstreet market identifiers. Deze bron verwijst naar ‘boven’, naar het moederbedrijf en  hier vind je ook de namen van bestuurders. Zo kun je ook vinden wie waar en in welke board zit.

Marktinformatie
Marktrapporten zijn erg duur en hebben allemaal dezelfde structuur:  LexisNexis heeft deze in losse onderdelen opgeknipt en in het bestand opgenomen. Bv data monitoring report.
Je zoekt dus in de informatie binnen een rapport.
Je betaalt per pagina, maar dat is wel veel voordeliger dan het hele rapport aan te schaffen. De grafieken zitten er als tabellen in, en die zijn dus via excel weer uit te voeren als diagram. (download table).

Personen
Via de optie ‘Personen’ zoek je naar Captains of industry en politieke leiders.
Het is handiger om via Bedrijfsinformatie op namen van personen zoeken: daar kun je vinden wie waar werkt of waaraan verbonden is.

Je zoekt steeds in dezelfde bronnen, maar op een andere manier.

—-

Presentatie over media-analyses: http://www.lexisnexis.nl/dutch/media-portal.aspx

NVB10 : Bertus Douwes – De meertalige trefwoordenthesaurus

De ondertitel van deze presentatie is Wat onzichtbaar is, zichtbaar maken … kijk dat ‘triggert’ de nieuwsgierigheid

Albertus Douwes is werkzaam als projectleider kenniscentrum bij Bibliotheekservice Fryslân (BSF), waar hij zich bezig houdt met de coördinatie van vernieuwings- en veranderingstrajecten, zoals het coördineren van de optimalisatie van de logistiek van het Fries Bibliotheken Netwerk.

Onder de noemer ‘Collectie Fryslân’ worden via de Friese provinciale Aquabrowser de bibliotheekcollecties ontsloten van Tresoar (Fries historisch en letterkundig museum), de basisbibliotheken van het Fries Bibliotheken Netwerk, het Historisch Centrum Leeuwarden, Historisch Informatiecentrum Noordoost Fryslân en de landelijke databanken. Collectie Fryslân is een meertalige collectie maar de toegang is taalgebonden. Dat wil zeggen dat in het Nederlands gestelde zoekvragen resulteren in Nederlandstalige titels en omgekeerd in het Fries gestelde zoekvragen resulteren Friestalige titels. Daarmee is een deel van de beschikbare informatie niet direct zichtbaar voor de bezoeker. Voor het zichtbaar maken van deze informatie is een vertaalservice ontwikkeld die, bij het muteren/indexeren van de provinciale Aquabrowser, de sleutelwoorden van een Nederlandstalige titel aanvult met de Friese vertaling daarvan en omgekeerd een Friestalige titel aanvult met Nederlandstalige de sleutelwoorden. Het klinkt eenvoudig en dat is het eigenlijk ook, maar er zijn altijd zaken die extra aandacht vragen. Bijvoorbeeld voor ambigue woorden is de vertaalservice aangevuld met contextafhankelijk vertaling. Wat de methodiek van de vertaalservice extra interessant maakt, is dat het ook te gebruiken is voor andere taalgebieden en daarmee breder inzetbaar is dan de huidige combinatie van Nederlandse en Friese taal.

De collectie bestaat uit 900.00 records!

Dit gereedschap kan ook op andere talen toegepast worden, zolang het maar een Europese schrijfwijze heeft.
Je hebt een terminologie beheersysteem nodig.
Woorden zijn echt een op een vertaald, zonder opmerkingen erover.
Met 15.000 termen hadden ze de meeste van de meestvoorkomende termen vertaald. De 15.000e kwam nog maar 5x voor, de rest zijn beetje eenlingen.

Termen gebruiken die in moderne tijd -niet voor de ‘permafrost friezen’ usance zijn, daarvoor heeft Fryske Akademy geholpen.

Ambiguïteitsoplosser is nodig om homoniemen uit elkaar te houden: bv “vliegen” is dat “fleane” of ‘miggen’, heeft het met beestje of met piloten te maken. Deze oplosser kijkt dus naar de context waarin een woord gebruikt wordt. De ambiguiteitsoplosser kan getraind worden.

Vertaalserver aanroepen met XML communicatieprotocollen. Cachen is mogelijk door deel op je eigen systeem hebben en bij aanroep updaten, dan hoef je niet steeds over het internet.

Taalherkenner: wat is typisch voor een taal? De  Y komt bijv veel in het Fries voor, de sch in het Nederlands.

Elke keer als iets wordt aangeboden, wordt het meteen in twee talen aangeboden: dus ook recente artikelen uit de krantenbank, die aangeboden worden via Aquabrowser.

Er worden niet hele teksten vertaald, alleen woorden. Zoeken op ‘ielguozzen”  geeft in de aquabrowser:

Uw zoekopdracht is uitgebreid met ‘Aalscholvers’

Je kunt dat aan en uitzetten.

Dit systeem wordt overgedragen aan bibliotheek.nl

Probeer het zelf op ontdekdebieb.nl

Bertus is beetje een droogkomiek ;-)

Je kunt dat aan en uitzetten.

Rijksoverheid.nl

De Ministeries van BZK, Justitie en VenW zijn overgegaan op Rijksoverheid.nl. Vanaf 12 juli 2010 zijn de websites  Minbzk.nl, Justitie.nl en Minvenw.nl uit de lucht,  in het derde kwartaal gaan ook de ministeries van VROM en SZW over en eind 2010 volgen Buitenlandse Zaken, Defensie, Financiën en LNV.
Het is een strakke website geworden, en de alert die ik had lopen is overgenomen.
Maar ik miste wel de mogelijkheid om een Magazine dat BKZ full-text had (Magazine Nationale Veiligheid en Crisisbeheersing)  te raadplegen.

Ze hebben een tabblad met Documenten en publicaties, maar daar staan geen ‘Magazines’ of ‘Tijdschriften’ als type publicaties bij.
Via zoeken op ‘trefwoord’  Magazine kwam ik wel bij  een cryptische aanduiding Magazine NVCB met een link naar de inhoudsopgave van inderdaad het gewenste tijdschrift.  Die inhoudsopgave, dat is al te mager.  De overheid publiceert veel, en het is een goede zaak als ze dat ook full-text op het internet wil zetten, het zou jammer zijn als ze daarmee ophouden.
Het op deze manier -via ‘trefwoord- moeten zoeken is ook niet handig: je vindt gauw veel te veel. Zeker als de andere ministeries daar bij komen, is het wel zaak om dat verder aan te pakken.

Ik heb ze een reactie gestuurd en ze antwoordden per omgaande dat ze ernaar zouden kijken:  netjes.
En een paar dagen later al:  als je nu zoekt op ‘Magazine’ vindt je  Magazine Nationale Veiligheid en Crisisbeheersing mei-juni 2010 de complete naam met een link naar de full-text!  Mooi zo.

Nu nog een rubriek ‘Magazine’  en een overzichtspagina van alle oudere magazines  bij elkaar, liefst per jaar en ik ben weer helemaal tevreden.

Bibliotheken en het online leven in April 2010

Een koude Pasen en een hete Vulkaanuitbarsting in  IJsland : dat laatste was  een drama voor het vliegverkeer, maar het levert mooie plaatjes op.

Bibliotheek

April, de maand van de congressen: U Game U Learn is gehouden zie blogs van Michael Edson en Blogpartyned. En ikzelf mocht, met nog 8 andere Nederlandse collega’s naar de emtacl10 in Noorwegen.
De CIL2010 was deels te volgen via tweets en de lifestreem. Paar quotes die ik opgepikt heb:

Marshall: we live in a post-metadata age
Peter Webster: Put everything on Google if that’s where People want to Search
In the digital age, everything is saved and little is preserved

Sommige collega’s worden door het werk voorgehouden dat werk=werk en privé=privé …  Die P&O afdelingen hebben a) het nieuwe Werken niet begrepen,  b)  niet begrepen dat een goede informatiespecialist eigenlijk een soort huisvrouw is: je werk is nooit klaar.
Streven wij naar ander imago komt Keith Richards met: It’s only books n shelves but i like it.
Verder van / over bibliotheken:

Databases

  • ACM digital library heeft een bar slechte uitvoer naar RIS. De gevonden items daar plak ik in Scholar, of in Scopus en voer ze dan via een Direct Export in Refworks in.
  • Scopus geeft tegenwoordig na een search alert ook de verwijzingen in die alert die nog niet in Scopus stonden. Ze staan op je scherm, maar je kunt er niet op klikken of ze via output bewaren. Prima dat ze die geven, maar buitengewoon irritant dat je ze niet kunt inlezen in een Reference manager systeem
  • Has EBSCO become the new evil empire?

Google

Online leven

Kopieerbescherming verpest vertrouwen in de markt, maakt boeken instabiel, schoffeert consumenten en levert auteurs niets extras op

Research / citaties

  • Biomedexperts  Explore & expand your personal scientific network
  • Scientists Embrace Openness (Science)   ‘challenge of opening up your data
  • Je kunt een RSS feed in Refworks plaatsen (een Scopus alert bv) en dan de records vandaar inlezen… dat is gemakkelijk! Je hoeft ze niet automatisch in te voeren: kun je ook weer selecteren, daarmee is het beheersbaar. Maar in de praktijk werkt t toch een beetje raar: hoe kun je nu die feeds op ‘gelezen’ zetten als je ze niet wilt inlezen? Daar is geen opdracht voor.  En hij leest er altijd 21 in, dat is ook raar. Misschien voorlopig toch maar met ‘gesavede’ zoekacties uit Scopus blijven werken
  • Rapport Veerman: Nederlandse wetenschap mist aansluiting wereldtop Maar waarom staat dat rapport niet online?

Web 2.0Happy foursquare day

Zoeken

Pluim

Bibliotheken, Informatie en het Online Leven in Maart 2010

Plaatje van Wikipedia

Tussilago farfara - klein hoefblad

Het klein hoefblad bloeit: het is lente en waarneming.nl heeft een mobiele versie waarmee je rechtstreeks in het veld kunt inventariseren.
Door de  steenslag op de wegen vanwege het door de vorst  beschadigde asfalt zijn heel wat autoruiten gesneuveld: een dorp is zo slim geweest de gaten in de weg te willen verkopen.
Veder is het kabinet is gevallen, was het natuurlijk ook weer boekenweek, is Twitter 4 jaar  (schoolrijp?) en heeft Bruna Geluksnijntjes (alleen niet voor boeken, dat is wel typisch voor een boekwinkel, maar verder vind ik ze geweldig).

Er is weer zoveel interessants langs gekomen, dat ik niet de illusie heb ook maar enigszins volledig te zijn, maar hier volgt dan wat mij deze maand is, onder vele andere zaken, is opgevallen:

Bibliotheek

Without libraries what have we? We have no past and no future.” ~Ray Bradbury
In  The death of the library book (‘what’s the use of libraries – really?’) maakt het Salon artikel het verschil pijnlijk duidelijk tussen wat gebruikers – wie dat dan ook zijn- willen en wat de architecten / bestuurders / managers doen Cambridge has a gleaming new main building, but something’s missing — and closing local branches won’t help.

what does happen to the network of public libraries once we stop leaving our homes to download books or access collections? Does reading and research become a less social activity? Or does the public aspect of ideas, knowledge, and research shift somewhere online? (bigmoney)

Databases

  • De website van Narcis is vernieuwd: weinig Web 2.0, en de cloud is nu weg, maar achter de zoekoptie zit nog wel RSS. Er is wel een NARCIS openSearch plugin
  • Gaat het wel goed met Elsevier?  Er gebeuren rare dingen, bijv met de Scopus search  alerts. Op een dag in maart kromp de set steeds meer:

set 1=8 docs set 2=14 docs in de alert mails. Maar als je  doorklikt naar het web:
set 1=7 docs, set 2=13 docs
set 1 OR set 2 = 12 docs
als je dan set 2 gaat bekijken krimpt hij ineens van 13 naar 12  … wat gebeurt daar?
set 1 (7 docs dus) in List gezet, set 2 (nu 12 docs) ook
daarmee handmatig een OR relatie gemaakt dus. Nu is die OR relatie ineens 13!

  • Een week later vertelde de  Scopus search alert mail dat er 11 hits zijn, maar de link naar de site toonde er 13. Hoe kan dat? Minder kan ik begrijpen (artikelen in press die uitgekomen zijn) maar meer: dat kan niet
  • Scopus heeft een ‘download’knop bovenaan de toon-artikel pagina’s geplaatst. Alleen moet je dan eerst de document manager Quosa installeren:  soms mag dat niet van de ICT.  Die klanten zien dus een download knop die ze niet kunnen gebruiken, en die Elsevier niet wil/kan verbergen :  dan moet je via de Linksolver doorklikken naar de full-text, maar dat moet je maar weten …
  • Scopus geeft de DOIs van artikelen in-press niet (altijd) goed weer: ik heb t aangekaard bij ze en mogelijk is het nu verbeterd. Let ook op de auteur met tussenvoegsels in de naam
  • Scopus life chat was onbemand: je kon ze mail sturen met je vraag:  daarvan kreeg ik wel bevestiging maar nooit antwoord

Google

Internet / Online leven

Het is leven is ingewikkeld geworden:

Van foksuk.nl

HNW: Het Nieuwe Werken (15 procent ict, 15 procent werkplek en 70 procent mindset) is ‘in’ : vluchten kan niet meer. De waarde van het Nieuwe Werken zit ‘m in het samenwerken (Frankwatching) aha: ik ben een generatie Y! Wordt  Wijzer met informatie (blog ‘Het nieuwe Werken)  en daarmee vindt Jos van  Dijk meteen maar de Informatiespecialist opnieuw uit als informatiecoach. Weer een nieuwe naam … zucht… a rose by any other name

Overall, college students use Wikipedia. But, they do so knowing its limitation. They use Wikipedia just as most of us do — because it is a quick way to get started and it has some, but not deep, credibility.

Wetenschap / research / Citaties / Peer review

Op Wowters blog RSS op een rijtje:

RSS overzicht van Wowter

Web 2.0 / Twitter

Als je je Plaxo account verwijdert (P voegt echt niets meer toe) voelt dat wel als een opluchting. Al weet je niet precies meer wanneer iedereen jarig is, je hoort het vanzelf via Twitter

Zoeken

Jammer

  • update naar Android 2.1  zou al in februari komen, nu pas eind april (verwacht)
  • Om een nieuw Delicious account aan te maken moet je eerst een nieuw Yahoo account aanmaken, en dat valt niet mee, Yahoo = echt vervelend gedoe

Pluim

Bibliotheken, Google en zoeken in Februari 2010

Deze maand bestaat mijn blogje 3 jaar en is zij over de 50.000 clicks heen gegaan. Ik blijf het toch verbazingwekkend, indrukwekkend en erg leuk vinden allemaal. Dank jullie allen voor ‘t bezoek!

Bibliotheken

Databases

  • Scopus heeft een Youtube kanaal, oa: – How to calculate the h-index
  • Alert bewaren in Scopus met een AND NOT erin is tricky: de alert krijg je wel, maar bij ‘bewaarde zoekties’ klopt de link niet
  • IEEE Explore heeft een nieuwe site opgezet, en daarmee vervallen ook alle e-alerts. Je moet ze handmatig weer zelf opzetten: konden ze blijkbaar niet automatisch overzetten. Voorheen kon je op naam en email adres alerts krijgen: nu moet je je eerst registreren. Dat verschil zorgt voor veel verwarring

Google

Google is echt niet goed bezig de laatste tijd: nu weer Buzz (soort Twitter in Wave versie gekoppeld aan Gmail) met Phil Bradley vind ik het Very annoying, volgens Eric Sieverts valt Google beetje van zijn voetstuk. Google is in fors gevecht met Facebook oa over de hegemonie van de sociale netwerken en informatie wereld als geheel. Maar mail is echt iets anders dan deze status updates / openbare discussietjes en Google kwam er al snel op terug: We May Remove Buzz From Gmail (Searchengineland)  en  The judgment errors in Google Buzz AND Google Books project explained. Veel mensen die al een aantal sociale netwerken hebben vinden het allemaal wat veel worden: het is wel tijd voor een aggregator en dat zal Google best willen worden, maar je moet er toch niet aan denken wat een macht / kennis ze dan hebben: niet alleen alle inhoud, maar ook alle connecties daartussen en tussen mensen. Toch wel beangstigend.
Nu publiceer je je Google Reader shared items automatisch als buzz-post,  net als je materiaal in je Flickr, Picasa etc accounts. Als je commentaar op een buzz bericht geeft krijg je dat ook nog eens als Email binnen: niet fijn, uitzetten dus #buzzoff!  Bullet Point: Dear Google, you too need to talk to librarians.
Er is nogal wat stampij geweest over de privacy: men kan nl zo in je profiel kijken, en daarmee ook je volgers zien. Ook dat kun je uitzetten, maar niet zo gemakkelijk.
With Buzz, Google takes another giant step towards turning into Microsoft (Guardian)  : ‘Bill Gates once said that Google was the only company that reminded him of Microsoft in its early days. How right he was’ Inclusief het hinderlijke voor-jou-denken: Disable Google Buzz and Lose your Google Profile.
(
Overzichtje van Pandia.)
Verder over Google deze maand oa:

Internet / online leven

Research / Citaties

Web 2.0 / Twitter

Zoeken

Jammer

  • De Twitter teller klopt niet erg: halverwege de maand werden de getallen ineens met 4 vermenigvuldigd. Even werd er zelfs teruggeteld, later weer rechtgetrokken
  • Facebook tijden kloppen ook niet: ‘vandaag’ bij hen, is ‘gisteren’ bij mij
  • Probeer een oude zonnet e-mail adres op te heffen. Dat valt nog niet mee… moet perse per telefoon
  • WordPress was 110 minuten down en met hen ook 10 miljoen weblogs…
  • KPN heeft het gepreseerd een halve dag een aantal sociale netwerken als Twitter / Foursquare niet door te laten. Via de Storingspagina was dat niet te vinden, maar door contacten van Tweeps met elkaar konden we achterhalen dat andere netwerken Twitter ed wel doorlieten. Ikzelf had een KPN verbinding naar mijn werk (dus geen Twitter) en al thuiswerkend via Surf kon ik er wel bij . Heel vreemd. Het wil dus echt zeggen dat ze websites selectief kunnen (en zullen) blokkeren.

Pluim

3 miljoen per minuut dacht ik gelezen te hebben, maar dat kan ik niet meer terugvinden, dus klopt vast niet ;-) ….

Mobiele app: RefWorks

RefWorks is ook in mobiele variant te krijgen: er zijn geen speciale apps voor, maar het werkt zowel op de iphone als op de  Android (en ook op een telefoon met en internet toegang). Je kunt de site benaderen via http://www.refworks.com/mobile/ : dan zie je ook meteen hoe hij overkomt op de mobiel.

Je moet altijd met de Groupscode inloggen. De mogelijkheden:

  • zoeken alleen de quick search, niet de advanced
  • references en attachments kun je bekijken
  • folders toevoegen
  • zoek / bekijk per folder
  • de notes kun  je toevoegen
  • de folders kun je bekijken, toevoegen en wijzigen
  • via SmartAdd kun je referenties zoeken en toevoegen

Wat niet kan zijn de connecties met Word onderhouden, sorteren, settings aanpassen, records zelf wijzigen e.d. Uiteraard kun je ook geen file inlezen: daarvoor heb je de ‘full-version’ nodig.

Toevoegen van referenties gaat via ‘SmartAdd:

With SmartAdd, users simply enter basic identifying information for a publication, such as ISBN number, digital object identifier (DOI) number, partial title, or author and publication year, and SmartAdd searches the Internet for the reference and import it to RefWorks..

Als je gegevens via auteur + jaar invoert, krijg je soms een aantal mogelijke titels waar je uit kunt kiezen.  Het kan wel voorkomen dat de gewenste titel er niet bij zit: -ook bij zoeken op DOI-  in dat geval moet je ze via de full-versie toevoegen. Het is mijn ervaring dat niet alle artikelen die bijv. in Scopus zitten ook op deze manier te vinden zijn: waar RefWorks de titels vandaan haalt is me niet helemaal duidelijk -ik vermoed uit een Proquest database- , maar als hij ze vindt, zijn ze wel erg compleet.

Het werkt goed. Indien  je een foutje maakt wordt je zoekboxje roodomrand.
In mijn  testen is er een lichte discrepantie tussen wat het systeem via de ‘Quick search’ in de ‘full-version’ vindt en wat hij vindt in de mobiele versie, maar eigenlijk bleek de mobiele de juiste resultaten te geven. Prima dus.

Zie verder info van RefWorks:

Bibliotheken, Google en zoeken in Januari 2010

V0lgens Forrester wordt 2010 wordt het jaar van de smartphone -  “Smart Phone”: It’s a Computer, not a Phone (RWW)  – misschien, maar januari was zeker al de maand van deze wondertjes: Google lanceerde de Nexus, en ikzelf kocht een eerste eigen HTC Hero, waar ik blij als blik mee ben! Over e-books en mobiele formaten is van alles te doen @Lukask schreef bijv over het verschil in benadering van Mobile Reading bijNRC en Het Parool en het ‘mobiele browsen’ in het algemeen. Een van die gevolgen daarvan is bijv dat er niet meer naar een bepaalde pagina gerefereerd kan worden, omdat die in elk ‘device‘ anders kan zijn. Ook de bieb is te raadplegen op de mobiel:  Accessing library catalogue & databases on your Mobile phone (Musings about librarianship), Worldcat en LibraryThing bijvoorbeeld.
En dan natuurlijk het Appel geweld met de ipad, ibooks en ichat, waar heel erg reikhalzend naar werd uitgezien, maar die wel een beetje tegenviel geloof ik: ik bemoei me er maar niet mee.

Bibliotheek

Surf verblijde ons -niet echt-  op 1 januari met de mededeling dat de SURFmailinglijsten per 1 jan 2011 ‘ uitgefaseerd’ zouden worden en daarnaast houdt Surfgroepen per 1-1-2012 op te bestaan met als een mogelijk vervolg de Collaboration Infrastructure (COIN).  Laten we hopen dat Surfnet de lijsten niet gaat vervangen door een ander tegenvallend product:  de Google Wave (ze hebben er nl wel onderzoek naar gedaan: Google Wave for Research and Education).
Ikzelf gebruik al jaren geen discussielijsten meer, maar hele volksstammen zijn voor hun informatie daar nog wel van afhankelijk. Nedbib-L heeft wel een blog, maar alleen als feed generator, en ze hebben nu als experiment een Google Groups gemaakt.
Dat Surft stopt met die lijsten kan ik billijken -is echt wel uit de tijd- maar dat ze de archieven wegdoen, dat is echt vernietigen van uniek materiaal en al zitten er weinig spelden in de hooiberg, het zou toch jammer zijn die zomaar te rooien.

Over het GII symposium, waar het GGC-wiel opnieuw is uitgevonden,  schreven Jan Klerk  Symposium Gemeenschappelijke Informatie Infrastructuur en Mark Deckers:  Meneer Deckers, wilt u de zaal verlaten en het einde van het IBL en de eigen catalogus.

Google

Google’s strength is not that it introduces new information but rather that it helps researchers find and communicate what is already out there. To scientists who are routinely drowning in data, that is incredibly valuable. Google has made access to data as simple as a conventional Web search—and that, in its own small way, is a scientific revolution

Informatie

Henk Blanken is een serie begonnen over informatie overload. 1: Informatie overload is een mythe 2: Ik heb internet uit 3 Informatiecrisis: we weten samen te weinig (aardig artikel met halverwege een rare draai) 4:  Het informatiegat: Shirky’s filter failure

Internet / mobiele leven

Wetenschap / Al dan niet Open Access / Publiceren

Zoeken

But we are solving the problem, through our aggregation. We’ve reduced the fear of missing something important because we share “controlled serendipity” with others and they with us. And without this collective discovery online, I couldn’t imagine trying to cull the tens of thousands of new links and stories that appear in the looking glass on a daily basis.
We are all human aggregators now.

UITSMIJERS:

Spijtig / onhandig:

  • Jammer dat in de 2.0 versie van PBworks de ‘magic url’ niet meer werkt, was juist zo handig om het voor een groep prive te houden
  • WordPress.com weblogs kun je private stellen maar alleen voor users met een account: voor groepen is dat niet handig
  • Onbeperkt internetten van KPN is beperkt tot zoveel-x gemiddeld gebruik …
  • ScienceDirect wil perse direct invoeren in RefMan, ook als je bewust kiest voor opslaan van file en NIET voor de Direct Import

Pluimpjes

  • Ha, de ‘Google code‘ is binnen: nog net laatste ex voor-ie uitverkocht is denk ik ;-) Ziet er leuk uit, leest lekker: Pre-Recensie van Wowter
  • @KroosSara “Balkenenditiaans gezegde: Met de kennis van nu, was de vriend van toen, al lang een kennis van nu”
  • Ovid auteurs truncatie met een * mag nu ook
  • True colors of Twitter
  • I love / hate / think / wish /believe mooie visualisatie van twistori
  • Interactive history timeline (British Library)  prachtig!