Kas jūs dzen? Nauda vai kas cits?
– Dažas dienas pirms mūsu tikšanās testēju Tildes Balss lietotni. Runājot lēni, tā tiešām teikto labi pārvērš rakstītajā. Runājot ātri, gan bija kļūdas.
– Kļūdām ir vairāki faktori. Viens no svarīgākajiem aspektiem ir audiosignāla kvalitāte. Lietotne, piemēram, ļoti labi apstrādā Latvijas Radio ierakstus. Man ir liels prieks par eksperimentu nesenajā LAMPAS festivālā uz skatuves Dzirkstele, kur pirmo reizi palaidām dzīvo transkripciju visām diskusijām latviešu valodā. Diskusiju dalībnieku teiktais tika pārvērsts tekstā, un tas bija lasāms tālrunī.
– Kam šāds eksperiments noder?
Citi lasa
– Galvenā mērķauditorija ir cilvēki ar dzirdes problēmām. Tas bija aizkustinoši. Cilvēkiem ripoja asaras, jo viņi klātienē varēja sekot un piedalīties gluži kā visi pārējie.
– Cik precīzs bija transkripcijas teksts?
– Festivālā neveicām baigi zinātnisko salīdzinājumu, taču mēs eksperimentējam arī ar Saeimas sēdēm, kur izmanto ļoti labus mikrofonus. Tur transkripcijas rezultāti ir augsti, nedaudz vairāk nekā 96 procenti.
– Tātad, ja atrisinātu signāla jautājumu, ieguvums būtu simtprocentīgs.
– Es gan to tik droši neapgalvotu, jo arī cilvēki, piemēram, runājot pa telefonu, viens otru simtprocentīgi nesaprot. Cilvēkiem palīdz, ja viņi viens otru redz. Zemapziņā mēs automātiski sekojam lūpu kustībām, kas palīdz dešifrēt signālu. Mēs dzirdam, pateicoties tam, ka mēs domājam. Skaņa vai teksts vienkārši tāpat neienāk ausīs. Smadzenes visu dešifrē.
Mūsu tehnoloģija pateikto analizē vismaz divos slāņos, proti, vispirms MI piefiksē sākotnējo minējumu, bet tad, ja frāze ir garāka, tas tiek pārskatīts sacītā kontekstā. Bieži vien garākais konteksts palīdz izlabot kļūdaini dešifrētu vārdu.
– Otrs virziens, kurā esat sasnieguši atzīstamus panākumus, ir mašīntulkošana.
– Mūsu sākotnējā pieeja mašīntulkošanā bija šāda – piesaistījām programmētājus un valodniekus, kas ar likumu palīdzību centās aprakstīt visas valodas īpatnības un tulkošanas sakarības. Tas bija drausmīgi lēns, sarežģīts un dārgs process. Un rezultāts nebija iepriecinošs. Mēs spējām no latviešu uz angļu valodu pārvērst ļoti primitīvu tekstu, piemēram, «Jānis iet uz skolu». Līdz ar sarežģītāku tekstu sākās arī problēmas.
– Tas bija vēl pirms mākslīgā intelekta?
– Tieši tā. Ar tā laika iespējām tālāk nespējām tikt. Un tad vienā konferencē es uzrunāju Filipu Koenu, kurš ir ievērojams Edinburgas Universitātes profesors. Koens jau bija nācis klajā ar jaunu priekšlikumu – likt datoram mācīties tulkot, neizmantojot likumu aprakstīšanu. Nu, lūk, es atmetu savu kautrīgumu un kafijas pauzē uzrunāju Koenu, sakot: «Mēs cīnāmies ar savu sarežģīto latviešu valodu, un varbūt jūsu metodes varētu mums palīdzēt.» Noklausījies manis teikto, viņš sāka domāt: «Kompleksa morfoloģija? Brīva vārdu secība? Mazs valodas lietotāju pulks? Baigi interesantā problēma!»
Pēc tam mēs kopīgi sagatavojām projektu, ko iesniedzām Eiropas Savienības konkursā Luksemburgā, kur, neskatoties uz lielo konkurenci, to apstiprināja.
Pēc punktiem jau bijām apstiprināmo sarakstā, bet vienam no komisijas ierēdņiem bija bažas. Viņš gribēja satikties un visu izrunāt. Viņš bija skeptisks, sakot: «Kaut kāda jauna metode, ja? Un kaut kāda sarežģīta valoda? Jūs tiešām to izdarīsiet?» Filips uz viņu paskatījās un jautāja: «Jūs mums neticat?» Tā mēs tikām pie finansējuma.
Rezultātā izveidojām sistēmu, kurā kā piltuvē var bērt iekšā tekstus, un dators no tiem mācās. Taču joprojām šie šķietamie sasniegumi nebija izmantojami ikdienā. Laikam ejot, bija attīstījušās gan tehnoloģijas, gan algoritmi, un te vienu dienu 2016. gada vasarā Google nāca klajā ar publikāciju par jaunu metodi, izmantojot neironu tīklus. Varbūt jums rodas jautājums, kāpēc Google izrādīja interesi par mašīntulkošanu? Viņiem ir pieejams milzīgs datu apjoms, visa informācija, kas ir internetā, atrodas viņu serveros. Bet ko ar to darīt? Viņi nolēma datus izmantot mašīntulkošanā.
– Kāda jēga milzim Google no mašīntulkošanas jeb Google Translate?
– Kāds ir Google bizness?
– Tirgot reklāmu.
– Tieši tā. Tad, lūk, jo vairāk lietotāju, jo vairāk pārdotu reklāmu. Lai sasniegtu lietotājus, viņi saprata, ka globālajā pasaulē nav tikai angļu valoda. Ir arī citas. Iepriekšējā gadsimtā informācija angļu valodā bija aptuveni 70%, tagad šī attiecība ir nokritusi stipri zem 30%.
– Kāpēc neironu tīkli kļuva iespējami?
– Bija sasniegta kritiskā masa. Pamatā ir trīs faktori – datu apjoms, jaunie algoritmi un datoru jauda. Pētniekiem radās ģeniāla ideja – izmantot ne vien tradicionālos procesorus, bet arī grafiskās kartes. Līdz tam grafiskās kartes attīstīja videospēļu nolūkos. Šobrīd ražotāji nespēj saražot tik daudz grafisko karšu, cik tiek pieprasīts neironu tīklu sistēmām.
Par mākslīgo intelektu runāja jau kopš piecdesmitajiem gadiem. Toreiz sistēmas bija pārāk vājas. Kāds profesors man reiz stāstīja, ka tad, kad viņš studējis, pasniedzēji viņam devuši padomu: «Ja gribi zinātnē nopelnīt, tad neej studēt mākslīgo intelektu, jo tam neviens netic.»
– Mūsdienās vietējie IT uzņēmumi pastāv uz to, ka Latvija nav tirgus, tāpēc strādā galvenokārt pasaulei.
– Runa ir par uguni, par dzinuli…
– Tieši tas mani interesē, proti, kas jūs dzen? Nauda vai kas cits?
– Man nesen TechChill konferencē sanāca asāka saķeršanās ar vienu guru – investoru no ASV. Viņš teica: «Ko jūs tur krāmējaties ar tulkošanu un valodām?» Viņš oponēja mūsu pieejai. Viņaprāt, fokusēties vajag lielā tirgus virzienā, jo nav vērts sadrumstalot resursus. Es viņa attieksmi uzskatu par racionālu biznesa kalkulāciju.
– Un ko viņam atbildējāt?
– Te ir runa par vērtībām. Vai tikai money, money, money var būt pietiekams dzinulis, kam veltīt savu dzīvi?
– Tātad nauda nav jūsu dzinulis. Labi. Bet kas jūs dzen?
– (Smejas.) Atkal Rainisms: «Lai tavs mūžs kam lieti der.» Nenodzīvot dzīvi veltīgi, bet tā, lai dzīves laikā radītu pozitīvu pievienoto vērtību.
Intervijas turpinājums: