Teadlased arendavad uusi masintõlke lahendusi

Tartu Ülikooli arvutiteaduse instituudi teadlased tegelevad närvivõrgupõhiste masintõlkesüsteemide loomise ja arendamisega. Uusi lahendusi pakutakse nii äripartneritele kui ka tavakasutajatele.

Tartu Ülikooli arvutiteaduse instituudi keeletehnoloogia professor Mark Fišel seletas, et uus masintõlkesüsteem kasutab tehisnärvivõrku ehk aju eeskujul ehitatud arvutuslikku konstruktsiooni. Tehisnärvivõrgus on teadmised kujutatud mustritena, andmete sisestamisega on võimalik süsteemi häälestada ja õpetada. Programmi häälestamiseks on vaja andmeid: originaaltekste ja inimese tõlget, et program saaks õppida tõlkimismustrit.

Varem kasutatud statistiline masintõlkesüsteem tõlkis sõnade või fraaside kaupa ja pani neid sõltumatute osadena lausesse kokku. Närvivõrgupõhine masintõlkesüsteem aga tõlgib tervet lauset ja näeb lause konteksti.

Mõte luua närvivõrgupõhist masintõlkesüsteemi tuli välismaalt, kus sarnaseid lahendusi kasutatakse ärimaailmas. Fišel ütles, et Eesti tõlkebüroo Grata OÜ näitas üles huvi uue tehnoloogia vastu ja niimoodi sündis esimene projekt, mis oli suunatud närvivõrgupõhise masintõlkesüsteemi loomisele.

Praegu tegelevad Tartu Ülikooli teadlased uue tõlketarkvara loomisega Luisa Tõlkebüroo OÜ jaoks ja suurema teadusprojektiga, mida rahastab haridus- ja teadusministeerium. Äripartnerile loovad teadlased tarkvaralahendusi vastavalt nende vajadustele. Luisa tõlkebüroole vajalikud valdkonnad on tehnika, arstiteadus ja õigusteadus. Teine projekt on suunatud eesti ja naberriikide keelte moodulite arendamisele. Projekti prooviversiooniga saavad Tartu NLP veebileheküljel tutvuda ka tavakasutajad.

Tartu Ülikooli arvutiteaduse instituudi keeletehnoloogia ärirakenduste koordinaator Liisa Rätsep ütles, et suurim raskus masintõlke puhul on just erialaste tekstide tõlkimine. Praegu teevad teadlased tööd selleks, et masintõlkesüsteem saaks näiteks õigusteaduse valdkonna tekste tõlkida.

Luisa Tõlkebüroo OÜ juhatuse liige Raili Kadak ütles, et nad on kogunud valdkonnaspetsiifilisi tõlkevasteid, mida võib kasutada masintõlkemooduli treenimisel. Kadak lisas, et tõlkijale jääb ülesanne toimetada masina koostatud teksti, seega võimaldab masintõlkesüsteem teksti kiiresti valmis saada.

Kadak ütles, et uue süsteemi kõige suurem oht on see, et masina tõlgitud laused on ilusad, aga nende sisu võib siiski originaalist erineda. “Kui statistiline masin tõlkis valesti, siis oli seda kohe näha, sest lause oli kummaline või naljakas,” lisas Kadak.

Mark Fišel ütles, et masintõlkesüsteem ei saa siiski inimest asendada. “Inimesega loodud teksti saab toimetada ainult inimene, sest ta saab teksti sisust ja kontekstist aru,” sõnas ta. Fišel lisas, et näiteks ilukirjandust ei saa programm tõlkida, sest peale tõlkimise on vaja säilitada tekstide kunstipärane väärtus. 

Kommentaarid