• Vēlies televizoru komandēt latviski?

    Intervijas
    Dace Rudzīte
    Dace Rudzīte
    6. septembris, 2023
    Komentēt

    Drukāt

    Saglabāt

    Foto: Shutterstock
    Lai televizors, automašīna vai telefons saprastu latviešu valodu un mēs varētu dot balss komandas latviski, nepieciešami mūsu balss paraugi. Tāpēc kopš pavasara norisinās projekts «Balsu talka», kurā ikviens varam dot savu artavu, ierunājot nelielu tekstu projekta mājaslapā balsutalka.lv.

    Kur ņemt runu?

    Kaut arī runas tehnoloģijas šobrīd strauji attīstās, tomēr aizvien daudzas iekārtas latviešu valodu saprot slikti. Piemēram, mēs vēl nevaram latviski komandēt televizoru, veļasmašīnu vai telefonu. Videozvanos nav iespējams automātiski un bez maksas izmantot latviešu valodas subtitrus labā kvalitātē. Tāpat ir maz lietotņu, kurās latviski varētu rakstīt, izmantojot balsi, nevis tastatūru.

    Tas viss tikai tāpēc, ka nav pieejami latviešu valodas runas dati.

    Lai šo situāciju mainītu, tehnoloģiju entuziasti – informācijas tehnoloģiju (IT) speciālists, programmatūras tulkošanas entuziasts Raivis Dejus un Latvijas Universitātes Matemātikas un informātikas institūta
    (LUMII) Mākslīgā intelekta laboratorijas vadošā pētniece Ilze Auziņa – aicina ikvienu iesaistīties un mājaslapā «balsutalka.lv» ierunāt nelielu tekstu. Iniciatīvas autori šīs vasaras laikā vēlas savākt 200 stundas, taču, lai izveidotu daudzveidīgu, atvērtu un ikvienam pieejamu latviešu runas datu kopu, vajadzētu ierunāt vismaz tūkstoš stundu.

    Ilze Auziņa stāsta, ka ideja par balsu vākšanu gaisā virmo jau labu laiku, jo zinātniekiem, pētniekiem un citiem interesentiem, kas izstrādā tehnoloģijas, ir problēmas ar to, kā iegūt datus – kur ņemt runu? Vai drīkst izmantot to, kas klejo internetā un sociālajos tīklos, ja to sargā personas datu aizsardzība? Tāpēc radās doma lūgt palīgā cilvēkus ielasīt tekstu, vienlaikus atzīmējot, ka cilvēks piekrīt savas balss izmantošanai. Līdzīga ideja bija arī Latvijas Atvērto tehnoloģiju asociācijai (LATA), kuru pārstāv Raivis Dejus, kas stāsta: «LATA vēlas, lai tas, kas vienreiz ir izveidots un ko cilvēki vienreiz ir saražojuši, būtu pieejams visiem. Uz šīs runas bāzes dažādu pakalpojumu sniedzēji varēs attīstīt savus pakalpojumus. Visa pasaule to vēlas, jo strādāt ar balsi ir viegli, un tā cilvēkiem ir dabiska. Jau pirms pāris gadiem interneta pārlūkprogramma «Mozilla» sāka veidot iniciatīvu, lai vāktu atvērto datu kopu, kas būtu pieejama visiem. Šogad tas labi saslēdzās, jo bija liela interese par mākslīgo intelektu, un arī mēs atgriezāmies pie šī jautājuma, jo parādījās jau gatavi, pasaulē izstrādāti rīki, kas, balstoties uz atvērtajiem datiem, strādā drusku labi, bet, lai strādātu pavisam labi, vajag pēc iespējas vairāk datu.»

    Pirmais aicinājums piedalīties «Balsu talkā» notika 4. maijā – ar domu, ka svētku laikā cilvēkiem būs vairāk laika un patriotisma noskaņās arī vēlme ierunāt teikumus no Annas Brigaderes «Sprīdīša». Otrs aicinājums sekoja Dziesmusvētku laikā, tomēr dziedātāji un dejotāji bija aizņemti mēģinājumos un koncertos, tāpēc visvairāk balsu ierunāja maija nedēļā. Savukārt Raivis aicina cilvēkus atkal sarosīties, jo: «Tas ir būtisks devums sabiedrībai, un ir fundamentāli svarīgi, lai latviešu valoda šajā digitālajā laikmetā būtu, eksistētu un strādātu.»

    Vajadzīgas dažādas balsis un izloksnes

    Un arī tas vēl nav viss – Ilze stāsta, ka šis projekts ļauj arī fiksēt to, kā cilvēki 21. gadsimta 20. gados runā. Kā latviešu valodā, nākot no dažādiem reģioniem un lasot teikumus tā saucamajā literārajā valodā, viņi tos izrunā. «Mums vajadzīgas dažādas balsis.

    Tāpēc svarīgi, lai savu balsi ziedotu ikviena vecuma cilvēki.

    Jo tieši daudzveidīgās balsis mēs atstāsim nākotnei. Šobrīd vecāka gadagājuma cilvēku runas mums pietrūkst, bet tā ir ļoti vajadzīga, jo viņi parasti nesūta balss ziņas, nedod savu balsi glabāšanā, un tāpēc tas, ka viņi ierunātu dažus teikumus, būtu ļoti liels pienesums. Jo viņi taču arī ir potenciālie runas tehnoloģijas izmantotāji, piemēram, ar balss komandu pārslēdzot televizoru, piezvanot draugam. Tāpat nav nekādas nozīmes, ka cilvēkam ir izloksne vai akcents. Tas nekas! Mēs vēlamies arī to cilvēku balss ierakstus, kuriem latviešu valoda nav dzimtā valoda, jo viņu runā ir citi akcenti, varbūt ne tik precīzi tiek izrunāti īsie un garie patskaņi. «Balsu talkā» iesaistījušies arī diasporas latvieši, un, klausoties viņu teikumus, uzreiz var dzirdēt, ka tas ir aizjūras runātājs.» Bet Raivis papildina: «Tas ir ļoti labi, tieši to mums vajag! Proti, mākslīgie intelekti strādā un spēj atpazīt to, uz ko ir trenējušies. Piemēram, ja būs ierunātas tikai vīriešu balsis, mākslīgais intelekts sapratīs vīriešus, bet sievietes – varbūt mazliet, taču ne tik labi. Līdzīgi ir ar dažādiem vecumiem un izloksnēm – mums vajadzīga cilvēku runa gan no Kurzemes un Vidzemes, gan Latgales – vajag pēc iespējas vairāk cilvēku un pēc iespējas dažādākus. Jo dažādākas balsis mums būs, jo pēc tam tās labāk strādās.»

    Kam mūsu balsis būs noderīgas?

    Lai arī mūsu ikdiena bez modernajām tehnoloģijām vairs nav iedomājama, mākslīgais intelekts daudziem vēl ir diezgan tumša bilde. Kam un kā tad mūsu balsis būs noderīgas? Kā skaidro Raivis, jau šobrīd tiem, kam ir «Smart TV» televizori, vismaz tiem ražotājiem, kas to piedāvā, uz pults ir podziņa «Mikrofons». To nospiežot, meklētājs atveras balss režīmā un mēs varam pateikt, ko vēlamies. Angliski šis balss režīms strādā labi, arī pie mums Latvijā, un tas ļoti labi saprot, ja viņam saka: «BBC News», un aizved mūs uz šo kanālu. Bet, ja vaicāsim, piemēram, lūdzu, ieslēdz «Panorāmu»! Lūdzu uzliec Raimonda Paula mūziku, diez vai balss režīms to sapratīs vai arī šos vārdus izmainīs.

    «Tad, kad mūsu dati būs pieejami, televizoru ražotāji, kas atrodas kaut kur Singapūrā, Amerikā vai kur citur, izmantojot «Mozilla Common Voice» platformu, šos datus varēs paņemt un savu televizoru ražot jau ar latviešu valodu. Šos datus varēs izmantot arī automašīnu ražotāji, un arī mūsu vietējie pētnieki un ražotāji varēs izgatavot subtitru ģeneratorus un attīstīt dažādus risinājumus, kas ļaus balsī runāt ar iekārtām. Runāšana ar gudrajām ierīcēm ir viens veids, kur to varēs izmantot, dodot komandas.

    Vēl viens izmantojums ir subtitru ģenerēšana vai kādās jau pavisam nopietnās sistēmās. Piemēram, radio ir liela datu bāze ar raidījumiem, un tur gatavo kopsavilkumu par nedēļu. Lai atrastu, kur prezidents vai cits cilvēks teica vienu vai otru lietu, radio darbiniekiem vai nu jāzina, kur tas bija, vai viņiem jāpārskrollē visi raidījumi un jānoklausās, kur viņš to varētu būt teicis. Ja būs šī balss tehnoloģija, runāto balss saturu, kas ierunāts ziņās vai pārraidēs, varēs atpazīt, un tad, kad tas būs atpazīts tekstā, to varēs meklēt – kā «Word» programmā. Vēl piemērs – tagad, kad zvanām uz zvanu centru, noteikti vajag otru cilvēku, kurš otrā galā paceļ klausuli. Mazliet tālākā nākotnē būtu tā, ka cilvēks piezvana un viņam pretī ir robots. Piemēram, es vēlos zināt, vai mans pasūtījums ir izsūtīts vai nav. Tagad, piezvanot uz internetveikalu, ilgi jāgaida, jo ir gara rinda. Ja atbildētu robots, kas uz vienkāršiem jautājumiem spētu atbildēt latviski, tad vairs nevajadzētu algot cilvēku, kas atbild zvanītājiem, bet darbinieki varētu darīt ko produktīvāku. Tāpat balsis varētu izmantot kādās sistēmās. Piemēram, neredzīgs cilvēks kaut kur atrodas un viņam vajag, lai pasaka, kā nonākt citā vietā. Viņš varētu paņemt savu telefonu, ar tausti sajust nepieciešamo pogu un telefonam pateikt: izsauc man taksi uz šejieni vai piezvani Valdim, vai ko citu. Robots telefonā saprastu, kur šis cilvēks atrodas un izsauktu taksi. Pielietojumu, kurus ar visu «Balss talkas» dalībnieku palīdzību varēs izveidot, ir ļoti daudz,» nākotni ieskicē Raivis.

    Jau tagad gan «Google», gan mākslīgais intelekts un virtuālie asistenti mēdz runāt latviski, tomēr, kā atzīst Ilze, tā tomēr ir nākotne, jo šobrīd ar virtuālajiem asistentiem lielākoties var sazināties rakstiski, nevis ar balsi. Arī Raivis piekrīt, ka sistēmas, kas mēģina ar balsi ko darīt, jau ir, bet tās labā vai puslīdz labā līmenī ir pieejamas lielajām firmām, kuras ir ieguldījušas savu naudu, savākušas balss datus un izstrādājušas savas sistēmas. Ar šo projektu «Balss talkas» rīkotāji demokratizē pasākumu, lai arī mazākas firmas un jaunuzņēmumi vai studenti, kas vēlas ko jaunu radīt, varētu šos datus ņemt un izstrādāt risinājumus mājām, saviem vecākiem un vecvecākiem, cilvēkiem ar īpašām vajadzībām vai kam citam. Datu ieguve ir laikietilpīga un sarežģīta, bet ar šo projektu tā tiek atvieglota.

    Jo vairāk balsu stundu tiks savākts, jo tās būs daudzveidīgākas un vēlāk labāk strādās.

    Projekta īstenotāji cer savākt tūkstoš stundu – tik daudz balsu stundas ir savākušas lielās valodas, piemēram, poļu, franču, vācu. Arī igauņi 2022. gadā sāka šādu akciju un arī ar uzsaukumu: «Ziedo savu balsi!» «Mozillā» viņi bija savākuši ap 50 stundu, mums ir 141 stunda – krietni vairāk nekā igauņiem. Arī somi organizē līdzīgas akcijas.

    Lai ziedotu balsi, pietiek ar telefonu

    Lai ierakstītu savu balsi, nav nepieciešams labs dators – tas nekas, ja tas arī čerkst. Tam pat nav vajadzīgs dators – pilnīgi pietiek ar telefonu. Cilvēks ar nākotnes sistēmu mijiedarbosies ar tādu ierīci, kāda viņam ir, arī no sava čerkstošā datora vai telefona, kuram fonā brauc mašīnas. Līdz ar to projektam der visi reālās dzīves apstākļi – nav vajadzīgi ne studijas mikrofoni, ne superlabas ierīces.

    Būtiski, lai, ierunājot tekstu, fonā nerunā neviens cits.

    Varbūt var skanēt viegla fona mūzika, taču tā nedrīkst būt balss ar vārdiem, citādi mākslīgais intelekts atkal nesapratīs, par ko ir runa.

    Tāpat projekta īstenotāji lūdz reģistrēties – tas nav obligāti, bet vēlams, jo tad var iegūt informāciju, kas ir runātājs: sieviete vai vīrietis, kādu vecuma grupu pārstāv – nekā sarežģīta. Var reģistrēties arī ar savu elektroniskā pasta jeb «Gmail» kontu. Jūnija beigu versija rāda, ka sievietes un vīrieši «Balss talkā» piedalījušies apmēram vienādi, tomēr mazliet vairāk sievietes. Taču nav zināms, kas slēpjas aiz tiem, kuri savu dzimumu nav norādījuši.

    «Visas ierakstītās cilvēku balsis nonāk datu bāzē un būs publiski pieejamas – kāds varēs jūsu balsi atrast un kaut ko ar to darīt. Vai izmantot arī krāpnieciskos nolūkos? Domāju, ka nē, jo vienā brīdī tur būs vairāki simti tūkstoši ierakstu, un atrast vienu konkrētu cilvēku nevarēs. Vieglāk ir kādam piezvanīt vai vienkārši uz ielas klusu pienākt klāt un ar mikrofonu ierakstīt viņa sarunas fragmentu. Tas gan ir bīstamāk, bet arī šeit no datu bāzes izmakšķerēt balsi būs grūti – krāpnieki te klāt netiks. Es pats savu balsi esmu ierakstījis un par to nemaz nebaidos,» pārliecināts Raivis.

     

    Satura mārketings

     

    Veselība

    Vairāk

    Receptes

    Vairāk

    Personības

    Vairāk

    Skaistums un mode

    Vairāk

    Bērni

    Vairāk

    Māja un dārzs

    Vairāk

    Izklaide

    Vairāk

    Labākai dzīvei

    Vairāk

    Aktuāli

    Vairāk

    Abonē