Päevatoimetaja:
Liisa Ehamaa

PÕNEV VÕI HIRMUTAV? Oma silm on troonilt tõugatud (1)

  • Üha kättesaadavamad manipulatsiooni-rakendused on põnevad, aga ka ohtlikud
  • Süvavõltsitud videod on jõudnud tasemele, kus võltsingut on keeruline tuvastada
  • Tehisaju areneb, aga ka kõige keerukamad algoritmid ei asenda inimese tunnetust

Veebruaris esitles tuntud veebiplatvorm fotodest võltsvideoid genereerivat rakendust Deep Nostalgia, mis kujunes sotsiaalmeedias tõeliseks hitiks. Otsustasin seda samuti proovida, söötes masinale ette oma vanavanaisa portree.

Ta ärkas ellu, uudistades terava pilguga tänapäevast maailma. Pööras pead, vaatas mulle otsa ja naeratas. Vanavanaisa «elustumine» mõjus isikliku kogemusena, pannes mind ühtaegu vaimustuma, kuid ka õõvastuma. Ma ei ole temaga kunagi kohtunud. Olen vaid lugenud tema päevikuid ja perekonnale saadetud kahetsevaid kirju.

Vanavanaisa fotoportreest paari hiireklikiga valminud video jahmatas. See pole ju päris, aga mõjub pagana realistlikult! Korraks tundsin end metsiku suguharu liikmena, kes näeb esimest korda fotot ja tahab seal kujutatud inimest kõnetada.

Olles tegev visuaalses meedias, arvan end omavat teatavat kogemust ja pildilugemise oskust, kuid esimene mulje MyHeritage’i genealoogiaplatvormi Deep Nostalgia rakenduse suhtes oli vaatamata tulemuse teatud «lopergulisusele» esmapilgul usutav.

Vaimustuse jahtudes muutusin aga skeptiliseks. Katsetasin mõne pildiga ajaloolistest suurkujudest. Lydia Koidula, Jaan Tõnisson ja Ernst von Baer pilgutasid silmi, pöörasid pead ja manasid näole tagasihoidliku naeratuse. Nüüd olin kriitilisem ja märkasin mitmeid ebatäpsuseid. Aga tuli tõdeda, et kokkuvõttes oli see neil siiski muljet avaldav sooritus.

Deep Nostalgia on siiski vaid väike osa arenduse potentsiaalist. Ettevõtte sõnul ei lisanud nad sellele inimhääle funktsiooni, kuid MyHeritage’i promovideo Abraham Lincolnist annab aimu, kui kaugele on arendajad tehisintellekti rakendamisel jõudnud.

Deepfake’i ehk eesti keelde tõlgituna süvavõltsingu õnge on lihtne minna. Kuigi mu isiklik näide vanavanaisa pildiga oli ilmsüütu ja reklaamteksti esitav Abraham Lincoln mõjus pigem humoorikalt, tajusin siiski, kui potentsiaalselt ohtliku tehnoloogiaga on tegemist.

Kõnekäänd «oma silm on kuningas» või «kuulsin oma kõrvaga» ei ole enam absoluutne. Asume vaid sammu kaugusel olukorrast, kus nii helis kui pildis manipuleerimine muutub massidele kättesaadavaks. Viimase paari aasta jooksul on süvamanipuleeritud videod jõudnud keerukuse astmele, kus tõelise ja võltsvideo vahel on keeruline vahet teha. Tehisintellekti abil on võimalik panna inimesi rääkima asju, mida nad kunagi pole öelnud, ja seda äärmiselt usutavalt ning suhteliselt vähese vaevaga.

Veel üks näide: paari aasta eest tekitas tormi Youtube’i postitatud video legendaarse saatejuhi David Lettermanni intervjuust koomiku Bill Haderiga. Jäljendades Hollywoodi filmitähte Tom Cruise’i, omandas Hader sujuvalt ja täiesti usutavalt Cruise’i näo.

Töötluse autor põhjendas oma tegevust vajadusega ärgitada üldsust kriitiliselt suhtuma sellesse, mida nad avalikus inforuumis näevad. «Ärge uskuge kõike, mida internetis vaatate,» ütles ta.

Alates tänavu jaanuarist seikleb võlts-Cruise populaarses äpis TikTok lausa mitmes episoodis, pälvides miljoneid vaatamisi. Tegemist on täiuslike võltsingutega, mida tehniliselt pea võimatu tuvastada.

Deep Nostalgia (peaaegu) tasuta rakendus on küll esimene tõeliselt massidesse jõudnud programm, kuid süvavõltsingu tööriistade arendamisega tegelevad ka teised firmad, näiteks Samsung, kes aastal 2019 esitles tehnoloogiat, mis võimaldab ühe kuni mitme pildi põhjal tekitada «rääkivate peade» videoid.

Neis pealtnäha süütutes mänguasjades peitub potentsiaalne oht – süvavõltsingu tehnoloogiaid saab kasutada ka pahatahtlikult eksitaval eesmärgil. Olgu selleks isiklik soov kedagi kompromiteerida, ärihuvid (näiteks võimalus turgu mõjutada) või poliitpropagandistlikud kaalutlused.

Ajakirjandusel ja uudisteagentuuridel lasub üha suurem vastutus, esitamaks igakülgselt kontrollitud ja tõest informatsiooni.

Ja nüüd olemegi silmitsi süvavõltsingute argiellu jõudmisega. Juba homme võib välja ilmuda anonüümne video, mis kujutab mõnd tuntud ühiskonnategelast tema au ja väärikust kahtluse alla seadvas olukorras või rääkimas juttu, mida ta tegelikkuses iial pole öelnud. Sellise materjali analüüsimine eeldab üha põhjalikumat eksperdi-taset ja faktide kontrollimist. Seega lasub ajakirjandusel ja uudisteagentuuridel üha suurem vastutus, esitamaks igakülgselt kontrollitud ja tõest informatsiooni.

Mullistunud inforuumis me sageli ei tea, kelle huvid mingi veebilehe või Facebooki grupi taga peituvad. «Sotsiaalmeedia gigandid juba arendavad deepfake’i automaatse tuvastamise ja mahavõtmise programme, mistõttu liiguvad võltsingud ilmselt veebi suletumatesse osadesse – privaatsetesse võrkudesse jms,» nenditakse Eesti-vastase propaganda paljastamisega tegelevas blogis Propastop.

Kokkuvõttes kehtib üks lihtne reegel: tarbige usaldusväärseid infokanaleid ja säilitage eluterve kriitikameel.

Hea foto saavutatakse inimliku tunnetuse kaudu, kaamera on vaid tehniline vahend selle jäädvustamisel. Kuigi tehisaju areneb üha kõrgetasemelisemaks, siis ka kõige keerulisemad algoritmid ei asenda ehedust. Nagu seda papist põhjale liimitud fotot mu käes. Sadakonna aasta jooksul pole see isegi mitte kolletunud.

Portree vana-vanaisast
Portree vana-vanaisast Foto: Erik Prozes

Mu vanavanaisa emigreerus noore mehena Austraaliasse, lootes seal paremat elatist teenida ja perekonna järele viia. Elu läks teisiti. Välja arvatud üks tütardest, ei näinud perekond teda oma ihusilmaga enam kunagi. Tehisintellekti abil tehtud video ei aidanud mul teda paremini mõista ega lähemale tuua. Teisalt ei võtnud see mult ka mitte midagi ära. Minu usk pärisasjadesse sai vaid suuremat kinnitust.

Mis on My Heritage'i Deep Nostalgia?

Veebipõhise genealoogiaplatvormi MyHeritage tehisintellektil põhinev tööriist Deep Nostalgia võimaldab masinõppe kaudu animeerida fotodel kujutatud inimeste näoilmeid. Staatilisest pildist video genereerimiseks kasutab tööriist eelsalvestatud videoid näo ja pea liikumistest, analüüsib konkreetset fotot ja tekitab sellest liikuva pildi.

Platvormi tegijate idee on võimaldada elustada oma surnud sugulaste fotosid animeeritud lühivideotena, pakkudes nõnda südantsoojendavat kohtumist.

Kasutajate tung neid videoid sõpradega jagada muutis rakenduse sotsiaalmeedias kiiresti suureks hitiks. MyHeritage ise nimetab seda interneti-sensatsiooniks. Vaid kuu aja jooksul alates esmaesitlusest on seal animeeritud üle 10 miljoni pildi. Kuigi lehe haldajad lubavad, et nad pilte endale ei salvesta, tasub kasutajatel oma isiklikke andmeid, sealhulgas pilte sisestades ettevaatlikkus säilitada.

Rakenduse looja on Iisraeli ettevõte D-ID, kelle peamiseks tegevusalaks on süvaõppe (ingl k deep learning) tehnoloogiate abil fotodega manipuleerimine.

Kuidas Deep Nostalgiat kasutada?

Alustuseks peab end kasutajaks registreerima. Laadides foto üles, tuleb mõnikümmend sekundit oodata, kuni pildist valmib animeeritud klipp. Seejärel saate selle alla laadida ning jagada oma lähedaste ja sõpruskonnaga. Tasuta saab üles laadida kuni viis pilti.

Tagasi üles