Eesti teadlaste läbimurre: robotid hääldavad eesti keelt sama hästi kui inimesed
Euroopa Liidu keeltevõrdsuse konsortsiumi värske uuringu kohaselt on Eesti teadlaste loodud keeletehnoloogia Euroopa tipus, 10 aastaga on eesti masintõlke kvaliteet paranenud kaks korda, arvuti suudab suulisest eesti keelest aru saada ja eestikeelset teksti inimesest eristamatult ette lugeda.
Euroopa Komisjoni toetatud Euroopa Keeltevõrdsuse (European Language Equality) konsortsium viis esimest korda pärast 2012. aastat läbi üleeuroopalise keeletehnoloogia taseme uuringu. „Tulemustest näeme, et eesti keele digitehnoloogiline tugi on üks Euroopa paremaid ja rahvaarvu arvestades iseäranis hea, eriti kiiresti on arenenud masintõlke ja kõnetehnoloogiate kvaliteet,” selgitas Eesti Keele Instituudi keeletehnoloogia kompetentsikeskuse juht Kadri Vare.
Vare sõnul saab välja tuua kolm kõige tähelepanuväärsemat läbimurret, mille Eesti teadlased on viimastel aastatel saavutanud. „Kõige tuntum keeletehnoloogia on masintõlge – peaaegu kõik on kasutanud Google Translate’i. Siin on meie teadlaste tehnoloogia mõnedes keelesuundades, sealhulgas eesti-vene ja vene-eesti, maailma parim ja edestab nii Google’it, Facebooki kui Yandexit. Selle olulisust kasvõi riigikeele õppe laiendamisel ja tõhustamisel ei ole võimalik ülehinnata,” ütles Vare ning kutsus üles seda vabavaralist tehnoloogiat kasutama.
„Teine praktiline suund on kõnetuvastus ehk kui hästi arvuti tavalisest inimkõnest aru saab. Siin on täpsus paranenud kümne aastaga rohkem kui kolm korda. Ka see tehnoloogia on juba praktilises kasutuses, näiteks genereerib tark robot subtiitreid mitmetele ETV otsesaadetele,” rääkis Vare.
Kolmanda läbimurdena tõi Vare välja kõnesünteesi. „Oleme jõudnud olukorda, kus arvuti loodud eestikeelne kõne on inimkõnest sisuliselt eristamatu. Sellisel tasemel kõnesüntees koos kõnetuvastusega tähendab, et enam ei ole tehnoloogilist takistust, et anda arvutile käsklusi ning kuulda näiteks otsingute tulemusi eesti keeles,” selgitas kompetentsikeskuse juht.
„Kuna ka eesti-inglise masintõlge on iga aastaga sisuliselt poole parem, jõuame varsti sinna, et eesti keeles on võimalikud sellised virtuaalabilised nagu näiteks Apple’i Siri. Samuti aitab kõnetuvastus ja -süntees näiteks vaegkuuljatel või -nägijatel paremini tööturul osaleda. See tähendab, et tänu keeletehnoloogiale saavad paljud, kes on olnud abivajajad, ise ühiskonda panustajateks,” rääkis Vare.
Kadri Vare selgitusel viiakse üleeuroopalisi keeletehnoloogia taseme uuringuid läbi, et anda riigijuhtidele ja avalikkusele infot, kus on Euroopa keelte digitoe kitsaskohad ja millised võiksid olla lahendused. „Keeletehnoloogia kasutuselevõtt määrab, millised keeled jäävad digiajastul püsima. Samuti avab tehnoloogia uusi võimalusi näiteks kultuurivara vahendamiseks emakeelde või keeleõppeks. Eesti keele olukord on hea. Kui me oma keeletehnoloogiat samamoodi edasi arendame, on reaalne, et saja aasta pärast on eesti keele rääkijaid tänasest märksa rohkem ning eestikeelne kultuuriruum märksa rikkam,” hindas Eesti Keele Instituudi ekspert.
- Euroopa Keeltevõrdsuse konsortsiumi uuring viidi läbi 2022. aasta jooksul enam kui 40 partnerasutuse kaasabil, analüüsides rohkem kui 6000 keeletehnoloogia ressursside ühiku baasil 30 Euroopa keele digitehnoloogilise toe olukorda, arengut ja väljavaateid.