Vidina tööpõhimõte seisneb selles, et kasutaja loeb telefoni eestikeelse jutu, mis salvestatakse helifailina. Seejärel laaditakse see fail üle andmesidevõrgu vastavasse serverisse üles ning seal toimub failis oleva kõne tuvastamine. Seejärel saab kasutaja oma jutu telefoni tekstina tagasi.
Põhiküsimus on muidugi see, kui hästi Diktofoni rakendus eestikeelsest jutust aru saab ning kui palju vigu teeb. Siinkohal väike näide: lugesime selge ja kõlava häälega telefonile ette riigikogu 19. oktoobri pressiteate ja võrdlesime algteksti kõnetuvastusel saadud tekstiga.
Algtekstis seisab: «Riigikogu maaelukomisjoni esindajate osalusel toimus täna riigikogus ühenduse Universitas Toompea haridusseminari arutelu teemaga «Eesti tänases arengus hästitoimivad ja mitterahuldavalt toimivad strateegiad». Arutelul osalejatele andis riigikogu ja valitsuse poolt kinnitatud strateegiatest ülevaate riigikantselei strateegiadirektor Keit Kasemets.»
Ette loetud ja läbi telefoni automaatselt kirjapandud tekstis seisab: «Riigikogu maaelukomisjoni esindajate osalusel toimus täna riigikogus ühenduse Universitas toompea haridusseminari arutelu teemaga. Jutumärgid Eesti tänases arengus hästi toimivaid ja mitterahuldavalt toime ja strateegiad jutumärgid kinni. Arutelul osalejatel andis riigikogu ja valitsuse poolt kinnitatud strateegiatest ülevaate riigikantselei strateegiadirektor Keit kasemets.»
Samalaadne rakendus, mida saab proovida ka lauaarvutis, leidub veebis: http://bark.phon.ioc.ee/webtrans/.
TTÜ küberneetika instituudi teaduri Tanel Alumäe sõnul peaks selle aasta sees avalikkusele kättesaadavaks muutuma ka rakendus, mis lubab telefonis kõnetuvastust kasutades sõnumeid saata.