Päevatoimetaja:
Marek Kuul

Eesti keelt mõistev arvutisüsteem võtab infotelefonineiudelt töö

Juhime tähelepanu, et artikkel on rohkem kui viis aastat vana ning kuulub meie arhiivi. Ajakirjandusväljaanne ei uuenda arhiivide sisu, seega võib olla vajalik tutvuda ka uuemate allikatega.
Copy

Teadlased loovad vabatahtlike diktorite häälenäidiste põhjal kõnetuvastussüsteemi

Ligikaudu 2000 inimest on registreerunud vabatahtlikuks diktoriks, et osaleda Tallinna Tehnikaülikoolis loodava kõnetuvastussüsteemi loomisel, mis võimaldaks näiteks infotelefonidel loobuda inimtööjõust.

Tartu ja Tallinna arvutiteadlased valmistavad ette halba uudist infotelefonide näitsikutele: kui neil õnnestub õpetada arvuti mõistma suulist eesti keelt, tuleb paljudel hotline’i tüdrukutel omale teine amet otsida.

Just infotelefonide muutmine arvutite pärusmaaks on esimene valdkond, kus eesti keelt mõistev masin võiks reaalselt tööle asuda, ütles Tartu Ülikooli keeletehnoloogiaprofessor Mare Koit.

Tegemist pole mingi ulmelise eesmärgiga - Inglismaal, Prantsusmaal, Saksamaal, Itaalias, Hollandis ja Rootsis võibki juba telefonitsi lennukipileteid tellida, rongiaegu uurida või teatripileteid reserveerida elusa inimesega suhtlemata.

Masin loeb soove

«Esmalt tuleb arvuti õpetada keelt - meie puhul siis eesti keelt - mõistma, teha selgeks sõnad ja lausepiirid. Siis järgneb morfoloogiline, süntaktiline ja semantiline analüüs,» rääkis Koit, kelle uurimisalaks on eestikeelse dialoogi modelleerimine arvutil. «Uurime, kuidas õpetada arvutile reegleid ja vorme, mida inimesed kasutavad omavahelises suhtlemises.»

Näiteks kui klient küsib arvutilt: «Kas te oskate öelda, millal väljub rong Elvasse?», ei tohi arvuti vastata vaid: «Jah, oskan.» Masin peab mõistma, et klient ootab talt kohe rongi sõiduaja teatamist, ehkki küsimusest seda otseselt välja lugeda ei saa.

Kui klienti huvitavale küsimusele ei ole võimalik kohe vastust leida, peab arvuti olema suuteline haarama otsingusse täiendavaid andmebaase ning kui needki ei aita, tuleb tal kliendile soovitada võimalikke asendusvariante, näiteks võimalust sõita Elvasse bussiga.

Kõige selle juures peab arvuti säilitama viisakuse - isegi kui soovitud infot tõesti pole, ei tohi ta sellest kliendile teada anda masinliku resoluutsusega, vaid inimliku kahetseva alatooniga.

Kõigi nende oskuste õpetamiseks uurivad Tartu teadlased esmalt reaalseid inimestevahelisi dialooge - kuidas neid alustatakse, kuidas formuleeritakse infosoove ning kuidas neid lõpetatakse. Eestlaste telefonidialooge uurides on Koit ja ta kolleegid näiteks täheldanud, et erinevalt inglastest ei jäta eestlased telefonis rääkimist lõpetades teineteisega hüvasti, vaid poetavad kõigest hädapärase tänusõna.

Arvutile eesti keele semantika selgitamise kõrval on sama oluline talle ka eesti keele kuulmise õpetamine. Just sellega tegeletakse Tallinna Tehnikaülikooli küberneetikainstituudi foneetika ja kõnetehnoloogia laboratooriumis.

Alates oktoobrist on laboratoorium korjanud 900 vabatahtliku diktori telefonitsi edastatud häälenäidet, kokku on vabatahtlikke diktoreid registreerunud 1729. Labori juhataja Einar Meister loodab, et aasta lõpuks on salves juba 2000 häälenäidet.

«Tuhat häält on miinimum, kuid mida rohkem, seda parem,» ütles Meister. «Tuhat inimest hääldavad üht ja sama sõna igaüks natuke erinevalt, kuid midagi peab selles olema ka ühist. Meie otsimegi universaalseid häälikumudeleid.»

Vabatahtlikud diktorid helistavad labori kõneautomaadile ning kordavad etteantud sõnu, fraase ja lauseid. Lõviosa senistest helistajatest on pärit Tallinnast ja Tartust. Töökindel kõnetuvastussüsteem peab aga mõistma ka murdemõjude või aktsendiga rääkiva inimese juttu.

«Saared ja Lõuna-Eesti võiksid meil tõesti rohkem esindatud olla,» tõdes Meister. «Kavatseme inimesi helistama kutsuda kohalike lehtede ja raadiojaamade kaudu.»

Infotelefoni 119 projektijuht Vallar Soone ütles, et operaatorite täielik asendamine arvutiga võiks teenuse omahinda küll odavdada, kuid samas kitsendaks info jagamise võimalusi.

Inimest ei asenda

«Infotelefoni tuleb üsna palju vabas vormis päringuid à la «seal kuskil asus mingi selline pood». Ma ei kujuta ette arvutit sellisele küsimusele vastamas, sest väga oluline on konteksti tabamine,» ütles Soone.

Tema sõnul aitaks eesti keelt mõistev automaat info andmist kiirendada lihtsamate päringute korral ning samuti oleks sellest kasu infosoovijate temaatilisel eelselekteerimisel.

Samas on ta veendunud, et alles jääb ka see tasand, kus arvuti ilma inimeseta toime ei tule. «Sageli küsitakse meilt ka lihtsalt: mis täna toimub? Kuidas peaks arvuti sellele vastama?» küsis Soone.

Tagasi üles