Quality Assessment in Crowdsourced Indigenous Language #TPDL2013

Laat een reactie achter

Quality Assessment in Crowdsourced Indigenous Language. Transcription. Ngoni Munyaradzi and Hussein Suleman

The digital Bleek and Lloyd Collecte on is a rare collection that contains artwork, notebooks and dictionaries of the indigenous people of Southern Africa. The notebooks, in particular, contain stories that encode the language, culture and beliefs of these people, handwritten in now-extinct languages with a specialised notation system. Previous attempts have been made to convert the approximately 20000 pages of text to a machine-readable form using machine learning algorithms but, due to the complexity of the text, the recognition accuracy was low. In this paper, a crowdsourcing method is proposed to transcribe the manuscripts, where non-expert volunteers transcribe pages of the notebooks using an online tool. Experiments were conducted to determine the quality and consistency of transcriptions. The results show that volunteeers are able to produce reliable transcriptions of high quality. The inter-transcriber agreement is 80% for |Xam text and 95% for English text. When the |Xam text transcriptions produced by the volunteers are compared with a gold standard, the volunteers achieve an average accuracy of 64.75%, which exceeded that in previous work. Finally, the degree of transcription agreement correlates with the degree of transcription accuracy. This suggests that the quality of unseen data can be assessed based on the degree of agreement among transcribers.

Spreker Hussein Suleman laat even een wereldkaart andersom zien dan we gewoon zijn, met Cape Town ‘at the top of the world’ .
Xam (Oorspronkelijke taal (talen) van Zuid Afrika) is dood, maar er is nog wel wat op schrift. En wat er is is buitengewoon belangrijk. Ze proberen dat te transcriberen. Standaard tools waren niet voldoende, omdat de tekens geen standaard Unicode waren.
Ze zagen ervan of om het automatisch te doen en lieten het mensen zelf transcriberen. Vrijwilligers deden het net zo goed als de bibliothecaresse, maar en als je ze laat samenwerken gaat het zelfs beter dan professionele mensen doen!
Het Seti project liet al zien dat ‘voluntary computing’ werkt: grote hoeveelheden kun je zo aan.
Volunteer thinking. Sommige dingen kun je een computer niet laten doen. Zo is er ook een project met melanomen : mensen zien sneller en beter wat het is dan een computer. Voor een computer is het ook moeilijk te zien of er mensen op een plaatje staan als er geen gezichten op staan. Mensen zien dat snel.
Pybossa.
Mechanical Turk is crowdsourcing? (klein mannetje in de machine verstopt)
Meerdere mensen hetzelfde laten transcriberen en kijken wat overeenkomt en dat stemde aardig overeen.
Hoe kom je aan die vrijwilligers?
Inspelen op verlangen van mensen ergens het beste in te zijn.
Een paar honderd mensen doen mee, is nog ongoing.
En zijn ze goed genoeg? slaan ze niet zomaar wat keys aan?
Je geeft ze een opening vraag als soort testje.

Digital Scholarship and Digital Libraries: Past, Present, and Future #TPDL2013

Laat een reactie achter

Maandag 09:30 – 10:30

Key Note “Digital Scholarship and Digital Libraries: Past, Present, and Future” by Christine L. Borgman.

In a few short decades, the practices of scholarship have been transformed by the use of digital resources, tools, and services. Some shifts are obvious, such as seeking, reading, and publishing research online, often to the exclusion of print. Other shifts are subtle, such as data being viewed as research products to be disseminated. Research objects are more atomized, yet aggregated in new ways. Digital technologies offer opportunities to innovate in scholarly practice, collaboration, and communication. Innovation in digital libraries is necessary to advance digital scholarship. The talk will present a set of challenges for 21st century research and practice drawn from Prof. Borgman’s forthcoming book, tentatively titled Big Data, Little Data, No Data.

Haar vorige boek: Scholarship in the Digital Age: Information, Infrastructure, and the Internet. Ze heeft meer dan 200 publicaties op haar naam staan.
(Ze vond de officiële opening erg goed en inhoudelijk.)

Haar recente onderzoek gaat over research data. Is groot topic.
Nadenken over nieuwe manieren van omgaan met techniek, onderwijs en bibliotheken.
We zijn op weg naar een echte cyberinfrastructure maar face to face blijft belangrijk.
Juist kleine landen zullen ervan profiteren als de toegang tot digitale info beter wordt.
Digital scholarship.
Neelie Kroes komt digitaal te langs, open access policies : verplichting tot publiceren. 50% is al open.
‘What to keep’ is echt een digitale bibliotheek issue.

Open scholarship was altijd al de norm, de formele en informele communicatie komen nu samen.
(Data kunnen ook de stenen zijn waarin hiërogliefen staan.)

Open access publiceren
Volledig OA of deels.
Open disseminatie neemt toe oa door repositories. Ze streeft ernaar alles van haarzelf daarin te stoppen.

Open Data en open ontologieen komen er nu aan.
Meer dan alleen research data: ook namen van organisaties ed.

Open Data collaboration.
Veel is mogelijk.
Interdisciplinair of per onderwerp.
Museum objecten.
Mini informatie publiceren, en micro distributie.

Maar lang niet iedereen doet er aan mee.
In openbaarheid werken is geavanceerde peer review.
Pro: Voorkomt fraude., vergroot snelheid en voorkomt ‘Free riders’.
Contra: Gevaar voor misbruik en verkeerde interpretatie. Soms terecht, soms onterecht.
Conflicten tussen publieke en private deelnemers (funding, partners,)
‘I don’t do data ‘ (dat is een argument dat niet meer opgaat)

Samenkomen formele en informele communicatie.
Publiceren duurt lang via formele weg. Informeel gaat veel sneller.
Maar dat is niet voor niets :
Papers zijn de culminatie van al het werk.
Daar hangen dan allerlei metingen aan:
Impact factors en h – indexen zijn altijd discutabel geweest.
En daar wordt veel te veel gewicht aan gehangen: wetenschap is veel meer dan dat Journal Article alleen. Er wordt veel meer dan alleen dat geproduceerd. Krijgt iedereen wel voldoende credit als je alleen eindproduct telt.
Hoe zit het met tweets? Mentions in tweets zijn ook citations. Worden die geteld? En in blogs?
Aantal downloads van het artikel, slideshare, talkshow, etc worden die wel meegeteld?
Citatie tellen is heel erg complex: ze hebben een rapport daarover geschreven.
Data citations and attributs Data science Journal 12, 13 september 2013. Rapport van paar honderd pagina’s

Big Data
Data kan op verschillende manieren Big zijn: Volume, aantal, varieteit.
Er is een Long tail of Data.
Ook verschillend per discipline.
Ook een klein beetje data dat heel complex is kan overweldigend zijn, terwijl heel veel goed gestructureerde veel hanteerbaarder kan zijn.

Wat is data eigenlijk?
Kan van alles zijn.
Marie Curie’s Notebook kan data zijn voor diverse soorten onderzoekers, maar voor anderen alleen noise. Ligt aan omstandigheden.
Data = Evidence
‘Industrial methods’ vs Artisanal methods’ van onderzoek : geeft andere data.

Data practices are local : interoperabiliteit is een heel groot vraagstuk om op te lossen.

Twitter API maken om data te hergebruiken.
Hoe je het ook bekijkt hergebruik is geenszins zo eenvoudig als het lijkt maar kan tot revolutionaire nieuwe methoden en uitkomsten leiden.
En je kunt ook uit voor jou niet leesbare talen data halen, zonder dat je zelf de talen spreekt.

Open access to data is a paradigma shift.

Sharing research data.
Op een manier dat ze door anderen te hergebruiken en interpreteren zijn is heel erg moeilijk te verwezenlijken.
Eigenlijk moet je dan ook het onderzoek zo opzetten dat het hergebruikt kan worden. De meesten doen dat niet.
Doel is dan de data, niet het artikel.
Meestal heeft data pas zin als je het uiteindelijke artikel erbij hebt.

Sharing data is a cultural issue

Er zijn veel soorten hergebruik.
Heel vaak gebruik je je eigen oude data ook niet meer.
Maar voor anderen is dat nog lastiger.
Data staat niet op zichzelf. Je hebt oa ook de modellen nodig.
(Wallis If we share data will any one use it? PloS one)
Je hebt een betrouwbare infrastructuur nodig om dat te stimuleren, waar digitale bibliotheken deel van uitmaken.
Nieuwe en moeilijke weg te gaan.

Goodman 10 simple rules for care and feeding scientific data (in review) PloS computational biology. (zie slide)

Love your data and let others love them too

What to keep.
– publications
– data: code documentatie provenance
– Links maken tussen allerlei zaken

Onderzoek opzetten met hergebruik in gedachten daarvoor heb je een data scientists / librarian / archivaris nodig. Maar we moeten wel beslissen wie wat doet, want dat is vaak een afschuiven: bepalen wat je wilt bewaren is dat een besluit vanuit de wetenschapper of vanuit de bibliothecaris?

Vraag:
Je moet het wel ergens kwijt kunnen, maar waar?
Kies een methode bijv Data verse

http://thedata.org/

Presentatie

Heterdaad RWS : Metadatering modellen #DIM13

Laat een reactie achter

Zie meer info op de site van de Digitale spin : Metadatamodellen

Vincent Teerling.

Metadata om
– objecten en onderdelen beschrijving (decompositie)
– documentaire informatie verrijken
– documenten informatie terug vindbaar en toegankelijk te maken

Langjarige fasen bezigheden
Verkenning planning realisatie beheer onderhoud
RWS heeft sterke ondersteuning nodig om die processen te ondersteunen.
In verleden veel verschillende systemen met andere invalshoeken om objecten te beschrijven.
Vaak waren ze ook relatief oud.

Daardoor gebrek aan volledigheid en operabiliteit.
Geen van de systemen is in staat volledig ontstaantscontext in kaart te brengen.

Ontwikkeling van Internationale standaarden voor metadata voor overheidssystemen.
En dat dan ook verplicht stellen.
Nen iso 23081 in 2006.
Mensen werken in processen en genereren daarin documenten.
Mandaat van die processen is bekend.
Bleef stil tot 2009 omdat t vrij Abstract was.
Later kwam er een Toepassingsprofiel voor ministeries.
Discussie generieke modellen die je dan weer specifiek maakt.
Voor deel is dat toegestaan.
RWS heeft eigen Toepassingsprofiel gemaakt.
Is excel lijst waarin staat wat er vastgelegd gaat worden, of t verplicht is of niet en hoe het erin komt.
(dat laatste bij voorkeur dus automatisch)
Bleek in praktijk niet fijn te werken.
Aanvankelijk 134 elementen waarvan 100 belangrijk en 80% kon automatisch gevuld, alleen waren die koppelingen er nog niet.
SP 2010 voldeed er ook niet aan. Bleek maar 35 velden en geen eigen RWS data.

Discrepantie filosofie SP en die van eigen Toepassingsprofiel.
Koppelingen met andere systemen zijn vereisten.

Nu
67 elementen waarvan 42 automatisch ingevuld kunnen worden. Incl specifieke RWS data

SP 2013 gaat anders om met metadata dam voorgangers.
Proof of Concept gebouwd waarin gekeken wordt of dit een intuïtief systeem oplevert.

Uitdagingen:
Adhoc toegang vs duurzame bewaring
Technische realisatie
Culturele acceptatie

Voor wie die je t eigenlijk?
Metadatamodellen toepassen op SP en op Trim (RMA)
In processystemen hoef je dat eigenlijk niet toe te passen.
In SP die processystemen benaderen.
Dat kun je doen als je die koppelingen goed legt.

DMS systemen slaan nu van alles op, bij opslag opruimen niet archiefwaardig stukken.
Als SP systeem goed werkt zou je die overdracht naar archief niet meer nodig zijn.

Ze zijn nog aan t experimenteren met het metadata systeem.
Er zitten meerdere Taxonomieen in.
Ook folksonomy: daarmee suggesties voor opname.

Presentatie: Metadata en Interoperabiliteit.pdf / Vincent Teerling

Heterdaad RWS : Content integratie + databases #DIM13

Laat een reactie achter

Zie meer info op de site van de Digitale Spin: Contentintegratie en databases.

Peter Nieuwenhuizen en Rita van Leeuwen.

Doel digitale informatie bronnen goed ontsluiten.
Goede search engines. (nu Fast van SP zou HP autonomy kunnen worden)


Digitale bibliotheek

Toegang via intranet.
Kennis en expertise is bibliotheek pagina
Nieuws, AZ lijst, links je naar bronnen.

Bronnen
– diversiteit
– Databases (nenconnect bv)
– full-text documenten
– portals (Kluwer)

Ebsco A-Z lijst
Titel. Vanaf wanneer, uitgever
Klik naar full-text.

Aansluiting bij beleving klant (google)
Probeer dat als norm te laten gelden.
Vooral niet zelf beheren, maar daar laten staan.

Kluwer is lastig, moet je jaar de site zelf.

LinkSource

Om artikelen vindbaar te maken. Via DOI.
Voorkeur Google Scholar en koppeling LinkSource.
Rechts links naar full-text, onder more zit ibl formulier naar Picarta.

EDS (discovery service)
1 zoekactie in meerdere bronnen.
Ranking inhoud. (kennisplein eerst)
Catalogus ontsloten, asfa (Proquest) , nieuws databases (AP, UPI) , Kluwer, picarta.
Plannen voor Ebsco : toevoegen Narcis, Academie, datasets Data Planet.
Plannen RWS: sdu, Kluwer, Yammer.

Lay-out kun je maken zoals jezelf wil.
Links en rechts clusteren.
Links:Vergroten of verkleinen bronnen, materiaal, taal, onderwerp
Rechts : Aanvullende bronnen bv Twitter. (In paar seconden wordt dat uitgevoerd) (leuk dat)

Grootste winst is je eigen rapporten en catalogus en de diverse betaalde zoeksystemen met eigen ingang samen te voegen in een zoekactie.
Aanpassen Ranking is wel te dien.
Ebsco loopt wat achter qua nederlaag bronnen dan C-content (?)

Vraag Ranken op aantal citationscitations?
kan niet.

—-

Presentatie: Content Integratie.pdf / Peter Nieuwenhuizen + Rita van Leeuwen

Heterdaad RWS : Sharepoint DMS + RMA TRIM #DIM13

Laat een reactie achter

Trim is het archief van RWS.
Begonnen in 2009 en is vrij goed product. Maar wel solitair systeem.
Dim was er tevreden over r, is robuust en digitale authenticiteit.
Maar Trim is nogal statistisch, je kunt de gebruikers niet zelf laten Metadateren. Voor gebruikers is Trim helemaal niet gebruiksvriendelijk.
HP leverancier ziet de functionaliteit beter door SP gedaan worden dus ze stoppen met verdere door ontwikkeling.

Gebruikerseisen:
Gemakkelijk beheer, overdracht naar archief automatisch, moet bedrijfsvoering ondersteunen, uitgaan van RWS medewerker = kenniswerker, state-of-art.
Alle medewerkers moeten bij alle kennis kunnen.
Er moet een duidelijk versie beheer zijn.
Alle informatie is openbaar tenzij.
Of iets openbaar is of niet ligt bij de proceseigenaar. Dim adviseert over hoe ze daarmee om moeten gaan.
Document life cycle als kapstok gebruikt voor ontwikkeling systeem.
90% gebruikerswensen konden door SP worden voldaan. Geen maatwerk, wr zijn niet zoveel anders dan andere organisaties.

Indeling : Afdeling / programma / project persoonlijk / team
Enige dat maatwerk is is afdeling.

Documentbeheer: werkwijze die net goedgekeurd was door bestuur, kon als linker navigatie fungeren.
Zo krijg je startpagina van project met alle stappen, centrale agenda, projectplandossier ed.
Rechts product link (presence, namen van mensen, chatfunctie ed)
Projectplandossier is een website (SP library) met daarin alle documenten.

Ene deelproces kan andere metadata hebben dan andere. Dan is t handig om dat afzonderlijk op te slaan.
Overerving : metadata van documenten wordt automatisch toegevoegd. Op een plek wordt die metadata onderhouden.
Wijzigingen in tags kan 2013 blijkbaar doorvoeren in documenten.
Verplaatsen van documenten naar ander dossier heeft consequenties voor metadata.
Ze gebruiken Docgen om documenten aan tw maken.
Als je sjablonen neerzet voor gebruiker moet je zorgen dat zoveel mogelijk metadata al ingevoerd is.

Per document ongeveer 30 velden metadata, 5-8 zelf in te vullen door gebruiker, als men tenminste via aanmaak documenten in de juiste site opent.

—–

Presentatie: SharePoint DMS en TRIM RMA.pdf / Ron Spierings + Robert-Jan van Leeuwen

Heterdaad Rijkswaterstaat opening DIM-visie #DIM13

Laat een reactie achter

Simon Been heet ons welkom en vertelt iets over Papieren Tijger. Meestal zijn hun sessies – onderwerp documentmanagement – niet gratis.

RWS is heel groot ca 9000 fte, maar ze gaan ateeds kleiner worden, maar met dezelfde taken. Documentatiemanagement valt onder Facilitaire Dienst.
Peter de Jong houdt inleiding.
Thema milieu is laatst ook bij RWS gekomen.
Informatie deling is cruciaal. States of the Art oplossingen. Ze willen af van diversiteit.

Anne van Veen programma manager DIM-visie. (herstructurering informatie management).
Informatievoorziening van alle bedrijfsprocessen.
Verantwoordelijkheid in de markt zetten, zelf regie voeren.
Uit goede informatievoorziening kun je veel financieel voordeel halen.
Je moet continue zorgen dat het op orde blijft : visie.
Ondernemingsplan heeft informatievoorziening als bindend element, strategische richting, (1 RWS), flexibel blijven, SharePoint 2013 incl DMS, Trim als RMA (record management systeem, niet als DMS). Koppeling processystemen, dus niet info uit SAP in SP halen, wil koppelen.
SP blijft gestandaardiseerd en uniform.
Keuze Trim is een politieke.
Vorige keren was een dergelijke project niet succesvol, nu gedragen door top management, zie t als verandertraject, niet puur als ict project.

Elke medewerker wordt verantwoordelijk voor op juiste manier toevoegen van eigen documenten.
Eenmalige opslag, meervoudig gebruik.
Metadata wordt zoveel mogelijk automatisch gedaan, maar deels moet men het zelf doen.
Informatie presenteren via views.
Informatie delen is meerwaarde, niet voor jezelf houden.
Andere systemen worden uitgefaseerd, ook ‘Mijn documenten’.

Streven: alles wordt gevonden in 60 seconden.

Meridian als zoekmachine /archief voor technische tekeningen.
SP 2013 heeft Fast geïntegreerd, SP 2010 niet.
Ze gebruiken veel Yammer, die wordt gekoppeld met SP.
Koppelingen gaan in release 2 komen.

Te bereiken door veel ‘omdenken’ : loslaten van traditionele denkpatronen, optimale gebruikersinbreng, Nieuwe werken, terugdenken vanuit samenwerking.

Per project wordt het transitie proces uitgevoerd.
Verandering in houding en werkwijze voor iedereen.

Vraag: kun je buiten SP nog documenten opslaan ?
Antwoord : nee.
Nuancering: In de mysite kun je wel documenten kwijt. Concepten bijv.

Vraag: gebruikersgroepen?
Antwoord: vanuit proces onderdelen samengesteld en mensen uitgenodigd.
Vaak in jaarbeurs oid. Opgezet door een extern bureau.
Terugkoppeling aan die groepen ook. Laten zien wat er gebeurd is en vragen naar meer input.
Heeft tot veel enthousiasme geleid.
Zo krijg je ambassadeurs.


Sheet komen op internet.

http://www.papierentijger.net/PTN/Welkom_op_de_Papieren_Tijger_Site.html

Presentatie

 

Zie ook

Hoe zoeken studenten #ebscodag

1 Reactie

3 IDM studenten van de Haagse Hogeschool vertellen hoe ze zoeken

ESA was opdrachtgever over project Deskresearch.
1 Oriënteren via Google en daarmee lijst termen genereren.
2 Google Scholar kijken welke tijdschriften en vind kernartikelen (veel geciteerd is dus belangrijker) en ze konden er meteen ft bij via linkresolver
3 Lezen artikelen en maak een lijst. Gericht Abstract, hele artikelen was wat veel. Daarmee basis database
4 Resultaat. Zijn dit goede artikelen? Zo nee opnieuw stap 2 etc.

Zo kwamen ze aan 30 artikelen

Deze manier van zoeken werd erg gestuurd door de docenten.

Nb kwam niet erg uit welke databases ze gebruikten naast Scholar :-)

(heb het in de pauze even aan ze gevraagd : via de school zoeken ze in aantal bestanden tegelijk. Zijn 1e jaars dus konden nog niet aangeven wat daar wel/niet handig aan is, alleen zagen ze t verschil qua onderwerp – medisch vs bouwkundig- wel)

30 jaar in het vak : learning all the time

6 Reacties

Deze blogpost is blijven liggen in 2009. Eigenlijk toch wel leuk, vandaar dat ik hem alsnog -bijna ongewijzigd- post.

Kan het zelf nauwelijks geloven, maar het was in november 2009 dertig jaar geleden dat ik mijn eerste serieuze baan kreeg. Marianne bereikte die mijlpaal het jaar daarvoor, en veel van haar observaties kan ik ondersteunen.

Opleiding

Na de middelbare school deed ik een beroepskeuze test en daar kwam o.a. bibliothecaris-documentalist uit, maar dat leek me reuze saai, dus ging ik maar fysiotherapie studeren. Tijdens de stages zag ik wel dat dat echt niets voor me was, dus daarna naar de Frederik Muller Academie (FMA) en dat was een makkie. Zeker die eerste twee jaar stelde weinig voor, jammer genoeg, want ik was juist inhoudelijk erg in t vak geïnteresseerd. Het meeste heb ik geleerd tijdens de stages: in de OBA en de medische bibliotheek van de VU.

Mijn geld verdiende ik toen als zaterdaghulp en invalkracht voor de filialen van de openbare bibliotheek Amsterdam. Dat heb ik daarna nog  zo’n jaartje gedaan: flierefluiten, rondrijden op de Harley en tussendoor wat werken in de OB. (Hoezo truttig imago ;-) ).
Daarna nog een jaar BD met als specialisatie de technische-, medische- en natuurwetenschappen. (Voor praktijklessen met de Harley naar de HTS in Haarlem, die liepen uit als ik aan kwam tuffen …).
Dat jaar was een stuk interessanter en inhoudelijker, maar helaas stopten ze dat jaar zo vol dat we overal te weinig tijd voor kregen.

Dymphie en Dr van Enk in bibliotheek SZ ca 1985Medische bibliotheek

De OB was niets voor mij, de medische bibliotheek wel, maar in de universitaire wereld mocht je destijds als HBOer hooguit titelbeschrijven, en om nou daar de hele dag mee bezig te zijn ….
Dus zo begon ik 1 november 1979 in het Slotervaartziekenhuis, voor halve dagen als collega van een oudere dame, maar met een hele bibliotheek zelf verder in te richten.
Een zucht van verlichting ging op toen ik daar aan de gang ging met het maken van aanwinstenlijsten als een soort nieuwsbrief, een tijdschriftenlijst en attenderingen door rondsturen van fotokopietjes inhoudsopgaven van tijdschriften en een circulatie van de ‘Current contents‘ opzette: die boekjes met inhoudsopgaven van ISI.

Catalogus

De catalogus wilde ik ook op titelwoorden toegankelijk hebben, maar dat betekende heel veel kaartjes maken (met de ‘minigraph’, een stencilmachientje) die vervolgens ingevoegd moesten worden:  wat een rotwerk. Maar je kon bijna overal op zoeken, dat wel.

Literatuur searches

Literatuursearches deden we via de Index Medicus: een wand vol dikke pillen hadden we in de leeszaal, en elke maand kreeg je een nieuwe pil met artikelen erbij. Voor een aantal artsen hield ik hun onderwerpen bij en stuurde ze een lijstje met voor hen interessante titels toe. De Science citation index was voor een ziekenhuis te duur, dat hadden ze alleen in de UB.

Online literatuurzoeken deden we nog maar weinig:  dat was duur en omslachtig, en de resultaten waren maar heel matig. Je deed dat door een formulier in te vullen en aan de KNAW op te sturen: dan kreeg je een week later een uitdraai van DIMDI. Per post.

Ik had een tv geregeld en via een terminal kon je een korte periode begin jaren ’80 door middel van Viditel zelf zoekacties in DIMDI doen, niet zo duur, en al wel wat beter, maar alleen via de command line, niet echt gebruiksvriendelijk.

De CD-roms kwamen halverwege 80er jaren op de markt: als eerste CSA, later andere merken. Daarmee kon je de een aantal jaren Medline aanschaffen en konden de artsen zelf zoeken! Groot succes.
En daarmee ook de start van de vele cursusjes ‘zoeken in de Medline': wekelijks voor de co’s en de arts-assistenten ( ik heb zo’n cursusje zelfs nog wel eens voor aankomende collega’s op de GO gegeven).

Het internet ontwikkelde zich: eerst  Gopher, waar je een lijst kreeg met alle Nederlandse adressen  waaruit je kon kiezen kreeg (meest universiteiten), daarna het WWW. De toegang tot de publieke Medline via PubMed duurde nog even, maar de medische wereld was er relatief snel bij.

IBL

Veel IBL hadden we te verwerken, het SZ was altijd al een ziekenhuis dat veel onderzoek deed: formuliertjes schrijven / tikken en opsturen aan diverse bibliotheken en dan kreeg je na een week of 3/4 een fotokopie per post terug. Het duurde een hele poos voor je dat online kon doen: nu krijg je een geplaatste IBL aanvraag zelfs vaak dezelfde dag of de dag erna in PDF via de email binnen.

Computer

Na een jaar of 7 had ik het wel gezien, maar toen werd het 1986 en deed de computer zijn intrede. Eindelijk een tijdschriftenlijst die je kon bijhouden in plaats van steeds opnieuw helemaal overtikken.

Ja die computer dat was wel wat voor mij.
We begonnen met Burroughs (later Unisys) een heel mooi en geavanceerd systeem dat veel te duur bleek, en waarvan 3 versies tekstverwerking langs kregen in een paar jaar.
Daarna WP met een aantal versies, en later Word. Aanvankelijk maakte ik nog uitgebreide macro’s in WP, maar bij elke nieuwe versie kon je die niet zomaar overnemen en kon je weer opnieuw beginnen. Uiteindelijk, vele jaren en 25 tekstverwerkingspakketten later, gebruik ik liever Notepad dan Word, en had lange tijd een lichte voorkeur voor WP (12 is het nu).
En Macro’s gebruik ik alleen nog in Notepad.
Voor de tijdschriftadministratie ging ik op zoek naar een programma, maar alle programma’s die ik zag werkten vrij onhandig: dat kon ikzelf beter. Dus heb ik in dBase II een programmaatje geschreven dat liep als een trein.
Leuke databasejes maakte ik ook in t begin: bijv met alle titels die we via IBL opvroegen, vergelijking van zaken over de jaren heen en zo, maar dat soort dingen heeft pas effect na een aantal jaren. Helaas veranderen die programma’s zowat elk jaar: dBase II ging al gauw over in dBase III (dat ging nog wel), maar versie IV en later Dataview en Dataperfect en Access, en niets neemt alles over, steeds weer opnieuw moet je uitvinden waar de basisknoppen zitten…
De gedachte was nog niet zo gek, maar het werkte dus niet echt over langere termijn.

Samenwerking

Bep (Sophia ziekenhuis) Dini (St Antonius) en ik startten in 1986 een samenwerkingsverband op voor ziekenhuisbibliotheken dat aanvankelijk de Strix-werkgroep heette, naar het catalogusprogramma dat we aanschaften. We hadden een formaat gemaakt dat voor een aantal bibliotheken hetzelfde was, zodat we elkaar de titelbeschrijvingen konden toesturen -op van die 51/4 en later 3,5 inch floppies-, om zo van elkaars werk gebruik te maken.

Dat elkaar titels toesturen was omslachtig, dus zochten we toenadering tot Pica voor een centrale catalogus: het was 1992 en we kwamen net op een moment dat er bij de universiteiten vanuit Pica gezien geen groei meer in zat. Met een aantal ziekenhuisbibliotheken tegelijk gingen we aan de gang met het catalogiseren in het GGC: de Strix-werkgroep werd CCZ (Centrale catalogus ziekenhuisbibliotheken)  en groeide uit tot ruim 80 bibliotheken.
Heel wat workshops heb ik gehouden daar in het Pica cursuslokaal om de collega’s de basisbeginselen van het catalogiseren in het GGC bij te brengen.
En later hielp ik daar Marianne met de internetcursussen voor diezelfde CCZ.
Leuk, gezellig en heel zinvol.

Leverancier Van Bremen hield met Strix op en Pica had een tamelijk goedkoop OPAC programma in de aanbieding: Micro-OPC (of MOPC, ze hebben nog steeds een download in dit formaat). Eigenlijk was dat een reuze handig programma:  flexibel genoeg om er zelf wat mee te doen. Met editten had je een heel leeg scherm waar de veldcodes niet in vakjes hoefden, zodat je die snel kon knippen en plakken. Nog steeds vind ik het heel jammer dat ze het niet naar de windows omgeving wilden ‘upgraden’, want inmiddels was het gangbaar om niet meer in DOS maar onder Windows te werken. Dus moesten we wel op zoek naar een ander lokaal programma.

Het is nog heel lastig om een goedkoop en flexibel lokaal bibliotheekprogramma te vinden, dat toch voldoende kon. We hebben er uitgebreid naar gezocht en uiteindelijk is het het Zweedse programma X-ref geworden.

Websites

Een  website maken leek me ook wel leuk, en daar ik inmiddels in de redactie van Biomedtiaties zat, leek het wel een goed idee om daar een website omheen te bouwen. Niet alleen voor de Biomeditaties, maar ook voor de CCZ en uiteindelijk bijna de hele BMI.
Aanvankelijk gaf de KB ons daar de ruimte voor. Rond 2000 wilde de NVB perse al haar kinderen onder een dak, en moest ons websitetje daar ook onder gebracht worden, toen vond ik ‘t tijd om ‘t over te dragen.
Nu is de BMI website weer apart van de moederkerk, zij het tijdelijk.
Het hele archief -ook van Biomeditaties- is op dit moment (2013) niet meer online te vinden: en dat is toch wel een aanfluiting zeker voor onze beroepsgroep. Maar hopelijk komt dat weer terug.

Heel veel werk hebben we verzet voor Biomeditaties tot in de niet-meer-zo-heel kleine uurtjes soms … en al doende leerde ik dus omgaan met HTML, XML en XLS, Frontpage, Dreamweaver etc.

Voor de grap heb ik ook nog eens geprobeerd hoe het werkte om met barcodes uit te lenen, ook goed te doen.

Andere baan

Leuk werk in zo’n ziekenhuis en werken voor klanten die je erg nodig hebben en op prijs stellen is heel plezierig, maar het eeuwige gezeur over de funtietypering en -waardering … het is onmogelijk om via die typering een behoorlijk niveau te halen. Bovendien leek het me wel interessant om eens in een andere bibliotheek te gaan werken: eens andere databases dan de Medline. Dus een andere baan.

Nou dat  heb ik geweten: met de Medline kon ik lezen en schrijven, maar er is een grote wereld buiten de medische, waar de informatie bovendien aanzienlijk minder goed ingedeeld / indeelbaar is.
PsycInfo probeert het wel, maar haalt lang niet de gestructureerdheid van Medline, om het over andere databases maar helemaal niet te hebben.
Ik kreeg een Dialog toegang, maar als een zoekactie al gauw 600 euro kost, dan gebruik je hem te weinig om er goed in thuis te worden: dat is echt een enorme rem op het ontwikkelen van je vaardigheden.
Bovendien zie je ook dat je klanten steeds meer echt alles helemaal zelf willen doen: er worden steeds minder zoekacties helemaal aan jou uitbesteed en eigenlijk is dat ook wel logisch. al houd je je hart vast als je ziet hoe matig soms de zoekvaardigheden zijn.
Blijft over lesgeven: cursusjes in zoeken in allerlei databases, RSS, Google, RefMan etc.

Steeds meer digitaal
Steeds meer tijdschriften komen online, inhoudsopgaven worden via e-alerts verstuurd, een linkresolver doet zijn intrede.
We proberen van zeer veel grote en kleine bibliotheken, bestanden en bestandjes een geheel te maken, dus veel conversie werk.
De boekjes met tijdschriftinhoudsopgaves werden wekelijkse flopies, en daarna een website.
Scopus deed de intrede een belangrijke sprong vooruit : een gebruiksvriendelijkere UI  dan tot dan toe gebruikelijk was.

Web 2.0

En dan doet in 2006 web 2.0 haar intrede en opnieuw veel gedoe om dat op het werk door de firewall te krijgen.
Maar mijn bibliotheekwebsite heeft nu een weblog, nieuws via Twitter,  CSE zoekmachinetjes op diverse onderdelen, nieuws per onderwerp  en natuurlijk RSS feeds uit de catalogus!
Delicious / Diigo moest ik al snel laten zitten, omdat je dat met meer collega’s voor elkaar moet boxen anders werkt het niet, en krijg maar eens alle collega’s op een lijn qua ‘social media’…
De plannen zijn verder:  meer interactie met de gebruikers aan de catalogus toe te voegen, etc. etc, er valt van alles te bedenken en te doen.

Het is toch zo’n leuk vak, en wat heb ik veel gedaan & geleerd, en ik heb er nog lang geen genoeg van …

————————–

* Tot zover de tekst die ik schreef in 2009, inmiddels is het 2013, ruim 3 jaar later en er is, zoals altijd,  weer van alles gebeurd.

Afschaffing fysieke bibliotheek

Met name de stap naar de opheffing van de fysieke bibliotheek was een grote, al heeft het niet eens zoveel te maken het daadwerkelijke werk: dat verandert vreemd genoeg nauwelijks. Dat wil natuurlijk enerzijds zeggen dat de fysieke collectie veel minder gebruikt wordt, maar ook dat een aantal taken gewoon blijven, al hef je de bibliotheek op: boeken bestellen, die ergens neerzetten en enigszins beheren, de behoefte blijft gewoon bestaan.
De bibliotheekdiensten die je zonder fysieke bibliotheek verricht zijn inhoudelijk dezelfde als met: namelijk mensen ondersteunen bij het vinden van de informatie die ze nodig hebben.
Je wordt alleen wat minder zichtbaar.
In de tijd dat er nog een fysieke bibliotheek was, had je een ‘visueel anker': nu moet je meer dan ooit steeds maar weer vertellen dat je doet. En dat de functiebenaming inmiddels van Bibliothecaris naar Informatiespecialist is gegaan helpt daar niet echt aan.
Inmiddels heeft het management gelukkig ook ingezien dat het ontbreken van een fysieke plek toch lastig is, dus nu worden er weer plaatsen in ruimtes ingevoerd waar boekenkasten kunnen staan: de ‘Distributed library‘ doet zijn intrede.
We zullen zien, maar saai is het nooit.

En zoals Seth Godin al zei: We need librarians more than we ever did en zo is dat!

Geinterviewd door de NVB

Laat een reactie achter

De NVB heeft een aantal leden geïnterviewd waaronder yours truly.. Ik dacht eigenlijk dat dat in het kader van het congres voor het 100 jarig bestaan was, maar het is pas 12-12-12 online gekomen.

Voor mijn eigen archief bewaar ik de tekst maar op deze weblog.

En mochten jullie benieuwd zijn wie me op het spoor heeft gebracht van de juiste opleiding? Dat was @Ecobibl.

Lees verder »

Bibliotheken en het Digitale Leven Juni 2012

2 Reacties

Ik denk erover te stoppen met de maandoverzichtjes. Tot mijn eigen verbazing doe ik dit al sinds Januari 2008!

Dit was de eerste: aanvankelijk heetten ze de maand ‘aan de hand van de tweets’ , later  Bibliotheekontwikkelingen in de maand … en daarna ‘ Bibliotheken en het online leven’ . Waar ik het laatste jaar maar het’  digitale leven’  van heb gemaakt.
De drang tot overzichtjes maken is overduidelijk aanwezig, maar consequent zijn is het volgende ;-) .

De reden om ermee te stoppen is dat het best wat veel werk is, veel mensen ook al overzichten maken, het er niet uit ziet en het terugzoeken in de weblog tegen valt.
Kortom de vraag is of het nog wat toevoegt, want ze zitten ook al in Pinboard.

En ook daar voorzie ik alles van een tag -een of twee keer in de maand-, zodat je toch wel zaken in een verband zet, voor jezelf. (De vraag of dat genoeg is al wel blijken, want ik was al eerder van plan te stoppen.)

Misschien blijf ik een soort overzichtsberichten plaatsen zoals onderstaand.
De complete Juni 2012 selectie uitgesplitst naar tags (link = hele tag, + = alleen die van juni) is het dan:

android  apps  books  chat  citation_analysis  cloud  computers  converis  culture  data  databases  dee’tjes  digitalisation  discovery  dropbox  duckduckgo  ebooks  europe  fun  future  galaxytab  goo  goodreads  google  health  history  infographics  internet  journals  knowledge_management  librarians  libraries  library_science  lifestyle  linked_data  maps  music  nature  netherlands  news  open_access  open_data  peer_review  privacy  quotes  research  scholar  science  scopus  searching  search_engines  semantic  summon  twitter  webguides  weblogs  websites  wikis  yammer

Voortaan maak ik een blogpostje in deze trant en voor degenen die me willen volgen: je zou een RSS feed op mijn Pinboard account kunnen nemen.