NVB10 : Bertus Douwes – De meertalige trefwoordenthesaurus

Laat een reactie achter

De ondertitel van deze presentatie is Wat onzichtbaar is, zichtbaar maken … kijk dat ‘triggert’ de nieuwsgierigheid

Albertus Douwes is werkzaam als projectleider kenniscentrum bij Bibliotheekservice Fryslân (BSF), waar hij zich bezig houdt met de coördinatie van vernieuwings- en veranderingstrajecten, zoals het coördineren van de optimalisatie van de logistiek van het Fries Bibliotheken Netwerk.

Onder de noemer ‘Collectie Fryslân’ worden via de Friese provinciale Aquabrowser de bibliotheekcollecties ontsloten van Tresoar (Fries historisch en letterkundig museum), de basisbibliotheken van het Fries Bibliotheken Netwerk, het Historisch Centrum Leeuwarden, Historisch Informatiecentrum Noordoost Fryslân en de landelijke databanken. Collectie Fryslân is een meertalige collectie maar de toegang is taalgebonden. Dat wil zeggen dat in het Nederlands gestelde zoekvragen resulteren in Nederlandstalige titels en omgekeerd in het Fries gestelde zoekvragen resulteren Friestalige titels. Daarmee is een deel van de beschikbare informatie niet direct zichtbaar voor de bezoeker. Voor het zichtbaar maken van deze informatie is een vertaalservice ontwikkeld die, bij het muteren/indexeren van de provinciale Aquabrowser, de sleutelwoorden van een Nederlandstalige titel aanvult met de Friese vertaling daarvan en omgekeerd een Friestalige titel aanvult met Nederlandstalige de sleutelwoorden. Het klinkt eenvoudig en dat is het eigenlijk ook, maar er zijn altijd zaken die extra aandacht vragen. Bijvoorbeeld voor ambigue woorden is de vertaalservice aangevuld met contextafhankelijk vertaling. Wat de methodiek van de vertaalservice extra interessant maakt, is dat het ook te gebruiken is voor andere taalgebieden en daarmee breder inzetbaar is dan de huidige combinatie van Nederlandse en Friese taal.

De collectie bestaat uit 900.00 records!

Dit gereedschap kan ook op andere talen toegepast worden, zolang het maar een Europese schrijfwijze heeft.
Je hebt een terminologie beheersysteem nodig.
Woorden zijn echt een op een vertaald, zonder opmerkingen erover.
Met 15.000 termen hadden ze de meeste van de meestvoorkomende termen vertaald. De 15.000e kwam nog maar 5x voor, de rest zijn beetje eenlingen.

Termen gebruiken die in moderne tijd -niet voor de ‘permafrost friezen’ usance zijn, daarvoor heeft Fryske Akademy geholpen.

Ambiguïteitsoplosser is nodig om homoniemen uit elkaar te houden: bv “vliegen” is dat “fleane” of ‘miggen’, heeft het met beestje of met piloten te maken. Deze oplosser kijkt dus naar de context waarin een woord gebruikt wordt. De ambiguiteitsoplosser kan getraind worden.

Vertaalserver aanroepen met XML communicatieprotocollen. Cachen is mogelijk door deel op je eigen systeem hebben en bij aanroep updaten, dan hoef je niet steeds over het internet.

Taalherkenner: wat is typisch voor een taal? De  Y komt bijv veel in het Fries voor, de sch in het Nederlands.

Elke keer als iets wordt aangeboden, wordt het meteen in twee talen aangeboden: dus ook recente artikelen uit de krantenbank, die aangeboden worden via Aquabrowser.

Er worden niet hele teksten vertaald, alleen woorden. Zoeken op ‘ielguozzen”  geeft in de aquabrowser:

Uw zoekopdracht is uitgebreid met ‘Aalscholvers’

Je kunt dat aan en uitzetten.

Dit systeem wordt overgedragen aan bibliotheek.nl

Probeer het zelf op ontdekdebieb.nl

Bertus is beetje een droogkomiek 😉

Je kunt dat aan en uitzetten.
Advertenties

Geef een reactie

Vul je gegevens in of klik op een icoon om in te loggen.

WordPress.com logo

Je reageert onder je WordPress.com account. Log uit / Bijwerken )

Twitter-afbeelding

Je reageert onder je Twitter account. Log uit / Bijwerken )

Facebook foto

Je reageert onder je Facebook account. Log uit / Bijwerken )

Google+ photo

Je reageert onder je Google+ account. Log uit / Bijwerken )

Verbinden met %s