Alles over vertaalmachines

Machinevertalingen worden beter en beter. Dat is ook nodig, aangezien bedrijven hun vertaalproces sneller en efficiënter willen maken door dit te automatiseren. Maar hoe komen machinevertalingen tot stand? Hoe werkt een vertaalmachine precies? In dit artikel zoeken we het uit.

Wat is een vertaalmachine?

Een vertaalmachine is software om een tekst van de ene taal naar de andere te vertalen. De software maakt gebruik van algoritmen, patronen en taalmodellen uit grote databases van bestaande vertalingen om een nieuwe vertaling te maken. De vertalingen die hieruit voortkomen zijn uniek. Een vertaalmachine is dus iets anders dan een vertaalgeheugen.

Verschillende benaderingen van machine vertalen 

Men houdt zich al sinds 1940 bezig met het ontwikkelen van technologie voor het automatisch vertalen van teksten. Door de jaren heeft men verschillende benaderingswijzen gehanteerd met wisselend resultaat. Er zijn drie verschillende benaderingen ten opzichte van machine vertalen: statistisch machine vertalen, regelgebaseerd vertalen en machine vertalen op basis van neurale netwerken. De afgelopen jaren zijn de ontwikkelingen snel gegaan door de nieuwste techniek gebaseerd op AI. Deze techniek wordt Neural Machine Translation (NMT) genoemd.

Statisch machine vertalen

Statisch machine vertalen werd voor het eerst geïntroduceerd in 1949. Deze techniek maakt gebruik van statistische taalmodellen met parameters die zijn gebaseerd op taalbronnen die bestaan uit grote gestructureerde datasets met tekst. De techniek staat bekend om zijn oppervlakkige vertalingen die vaak niet vloeiend zijn. De eerste versies van Google Translate waren gebaseerd op deze techniek. 

Regelgebaseerd machine vertalingen

Bij deze manier van automatisch vertalen wordt er rekening gehouden met grammatica en syntaxis. Een regelgebaseerd systeem heeft kennis van de grammaticale regels van de bron- en doeltaal. Regelgebaseerde systemen zijn gebaseerd op woordenboeken en veel taalkundige regels. Echter zijn er een oneindig aantal regels waar een taal nooit helemaal in gevangen kan worden. Regelgebaseerde systemen zijn daarom vaak niet flexibel om goede vertalingen te kunnen leveren.

Neural Machine Translation (NMT) 

De nieuwste techniek op het gebied van machine vertalen zijn machine vertalingen gebaseerd op neurale netwerken. Deze technologie bestaat sinds 2016 en gebruikt kunstmatige neurale netwerken om voorspellingen te doen over de volgorde van woorden en verbetert zijn vertalingen door te leren van bronnen en woordenlijsten. Voor het leveren van vertalingen gebaseerd op NMT is een behoorlijke rekenkracht nodig. Een vertaalsysteem als Euroglot is gebaseerd op deze techniek en werd gemaakt op een speciale, zeer snelle zelflerende computer. Met Euroglot NMT is het zelfs mogelijk om machinevertalingen te kunnen doen op de eigen server. Op deze manier blijven alle vertalingen binnenshuis en hoeft er geen gebruik van internet te worden gemaakt.

Hoe is het gesteld met de kwaliteit van machinevertalingen?

Hoewel automatische vertaalsoftware zeer goed is geworden, moeten de vertalingen altijd worden nagekeken en in sommige gevallen worden gecorrigeerd. Om te zorgen dat er een natuurlijke vertaling ontstaat, of om te zorgen dat terminologie consistent wordt gebruikt. Dit proces wordt MT post-editing genoemd en wordt uitgevoerd door taalprofessionals. Mens en machine gaan hier hand in hand om het beste resultaat te bereiken.