Kai mašina pradeda „suprasti” kalbą
Dar prieš dešimtmetį mintis, kad kompiuteris galėtų versti sudėtingą žurnalistinį tekstą taip, kad skaitytojas nepajustų skirtumo, atrodė kaip mokslinė fantastika. Šiandien tai – kasdienė redakcijų realybė. Automatiniai teksto vertėjai, ypač pastaraisiais metais išaugę ant didelių kalbos modelių pamatų, iš esmės perbraižo žurnalistikos geografiją – tiek pažodžiui, tiek perkeltine prasme.
Kalbame ne apie senus Google Translate laikus, kai išversti sakiniai skambėdavo kaip kažkieno bandymas kalbėti su žodyne rasta fraze. Šiuolaikiniai įrankiai – DeepL, GPT pagrindu veikiantys sprendimai, „Microsoft Translator” ir specializuoti žurnalistikai skirti produktai – sugeba perteikti ne tik žodžių reikšmę, bet ir tam tikrą kontekstą, toną, net stilistinį atspalvį. Tai keičia viską: kaip redakcijos dirba, kaip žurnalistai renka informaciją, kaip naujienų agentūros platina turinį ir, galiausiai, kaip skaitytojai gauna informaciją apie pasaulį.
Šis straipsnis – bandymas pažiūrėti į šį reiškinį be rožinių akinių, bet ir be nereikalingos panikos. Nes kaip ir su kiekviena technologija, čia yra ir tikrų galimybių, ir rimtų spąstų.
Kaip redakcijos iš tikrųjų naudoja vertimo įrankius
Pradėkime nuo praktikos, nes teorija be konteksto nieko neverta. Didžiosios naujienų agentūros – Reuters, Associated Press, AFP – jau seniai integravusios automatinius vertimus į savo darbo eigą. Reuters, pavyzdžiui, naudoja mašininį vertimą kaip pirmąjį žingsnį: sistema išverčia tekstą, o žmogus redaktorius jį peržiūri, patikslina ir patvirtina. Tai vadinama „post-editing” modeliu – ir jis šiuo metu yra populiariausias profesionalioje žurnalistikoje.
Mažesnės redakcijos elgiasi kitaip. Regioniniai leidiniai, neturintys biudžeto samdyti vertėjų kiekvienai kalbai, dažnai tiesiog paleidžia tekstą per DeepL ar panašų įrankį ir publikuoja su minimalia redakcija. Tai greita, pigi – ir kartais problemiška, apie ką kalbėsime vėliau.
Yra ir trečias modelis, kuris tampa vis populiaresnis: realaus laiko vertimas gyvų transliacijų ar greitai besikeičiančių naujienų srautams. Kai karo zonoje vyksta spaudos konferencija, o žurnalistas turi per 20 minučių parašyti straipsnį – automatinis vertimas tampa ne patogumu, o būtinybe. BBC, „The Guardian” ir kiti stambūs leidiniai eksperimentuoja su sistemomis, kurios verčia kalbą beveik realiu laiku, leisdamos žurnalistams sekti įvykius bet kuria kalba.
Praktinis patarimas redakcijoms: prieš diegiant bet kurį automatinio vertimo sprendimą, verta atlikti vadinamąjį „blind test” – paimti dešimt skirtingų tekstų (tarp jų – su idiomomis, kultūrinėmis nuorodomis, specifine terminija) ir palyginti, kaip skirtingi įrankiai susidoroja su konkrečia jūsų darbo kalba. Universalaus geriausio sprendimo nėra.
Kalbos barjero griūtis ir tai, ką ji reiškia žurnalistams
Viena reikšmingiausių pasekmių – žurnalistai nebėra tokie priklausomi nuo kalbų žinojimo. Tai skamba gerai, bet yra dvipusiška medalio pusė.
Teigiama pusė: žurnalistas, mokantis tik anglų ir lietuvių kalbas, dabar gali sekti ispanų, japonų ar arabų kalbomis rašomus šaltinius, gauti kontekstą iš vietinės žiniasklaidos, suprasti, kaip įvykis matomas iš kitos kultūros perspektyvos. Tai praturtina žurnalistiką. Anksčiau daugelis tarptautinių naujienų buvo filtruojamos per anglofonišką prizmę – dabar ta prizma bent iš dalies lūžta.
Neigiama pusė: kalbos mokėjimas nėra tik komunikacijos priemonė. Tai kultūrinis raktas. Žurnalistas, mokantis arabų kalbą, ne tik supranta žodžius – jis supranta niuansus, politines konotacijas, tai, kas sakoma tarp eilučių. Automatinis vertėjas to neperteikia. Jis gali išversti sakinį teisingai ir vis tiek praleisti esminę prasmę.
Konkretus pavyzdys: arabų kalboje žodis „šahidas” turi kelias reikšmes – liudytojas ir kankinys. Kontekstas lemia, kurią reikšmę pasirinkti. Automatinis vertėjas, neturintis gilaus kultūrinio konteksto, gali suklysti – ir tas klaida gali turėti rimtų pasekmių politiškai jautriame straipsnyje.
Todėl praktinė rekomendacija žurnalistams: naudokite automatinius vertimus kaip orientacinį įrankį, ne kaip galutinį šaltinį. Jei tekstas yra politiškai jautrus, susijęs su konkrečia kultūrine tradicija ar naudoja specifinę terminologiją – visada konsultuokitės su žmogumi, kuris tą kalbą ir kultūrą išmano iš vidaus.
Greitis prieš tikslumą: žurnalistikos amžinoji dilema nauju pavidalu
Žurnalistika visada balansavo tarp greičio ir tikslumo. Automatinis vertimas šią įtampą ne išsprendžia, o sustiprina.
Kai 2022 metais prasidėjo karas Ukrainoje, redakcijos visame pasaulyje susidūrė su milžinišku kiekiu ukrainietiškų ir rusiškų šaltinių. Vertėjų trūko. Automatiniai įrankiai tapo gelbėjimosi ratu – ir daugelis jų dirbo pakankamai gerai. Tačiau buvo ir klaidų. Kai kurios redakcijos paskelbė netiksliai išverstas citatas, kurios vėliau reikalavo pataisymų. Vienas žinomas atvejis – kai automatinis vertimas iš rusų kalbos neteisingai perteikė karinį terminą, ir tai sukėlė klaidingą interpretaciją apie kariuomenės judėjimą.
Greitis yra vertingas. Bet žurnalistikoje klaida nėra tik techninis nesklandumas – ji gali pakenkti žmonėms, formuoti klaidingą visuomenės supratimą, net turėti teisinių pasekmių. Todėl redakcijoms, kurios naudoja automatinius vertimus greitai besikeičiančiose situacijose, rekomenduojama:
- Aiškiai žymėti tekstus, kurie buvo išversti automatiškai ir dar neredaguoti žmogaus
- Turėti aiškų protokolą, kokie tekstų tipai gali būti publikuojami be žmogaus patikrinimo (pvz., rutininiai pranešimai) ir kokie – ne (politinės citatos, jautri informacija)
- Investuoti į bent minimalų „post-editing” procesą net ir skubiais atvejais
- Niekada nepublikuoti automatiškai išverstos citatos be papildomo patikrinimo
Paskutinis punktas yra ypač svarbus. Citata – tai žmogaus žodžiai. Jei jie išversti netiksliai, tai ne tik faktinė klaida – tai etinis pažeidimas.
Ekonominė revoliucija: kas laimi, kas pralaimi
Kalbant apie automatinius vertėjus žurnalistikoje, neįmanoma apeiti ekonominės dimensijos. Ji yra labai reali ir labai prieštaringa.
Redakcijoms – tai sutaupytos lėšos. Vertimo paslaugos tradiciškai buvo brangios. Profesionalus vertėjas už puslapį gali imti nuo 20 iki 80 eurų, priklausomai nuo kalbų poros ir sudėtingumo. Didelė redakcija, verčianti šimtus tekstų per mėnesį, galėjo išleisti dešimtis tūkstančių eurų. Automatiniai įrankiai sumažino šias išlaidas dramatiškai – kai kurios redakcijos teigia sutaupančios iki 70-80 procentų vertimo biudžeto.
Bet tas sutaupymas ateina kažkieno sąskaita. Vertėjų profesija žurnalistikoje – viena labiausiai nukentėjusių. Tai nėra spekuliacija: Europos vertėjų asociacijos duomenys rodo, kad žurnalistikos vertimų rinkos segmentas per pastaruosius penkerius metus susitraukė reikšmingai. Žmonės, kurie specializavosi versdami naujienų turinį, dabar arba persikvalifikuoja į „post-editorius” (kurie uždirba mažiau, nes darbas greičiau), arba ieško darbo kitur.
Čia svarbu nemoralizuoti, bet ir neignoruoti. Technologijų pažanga visada keičia darbo rinką – tai neišvengiama. Tačiau redakcijoms verta pagalvoti apie ilgalaikę perspektyvą: jei vertėjų profesija išnyks, kas liks, kai reikės tikrai sudėtingo, kultūriškai jautraus vertimo? Pigus automatinis sprendimas šiandien gali tapti brangiu kokybės praradimu rytoj.
Taip pat verta paminėti kitą ekonominę dimensiją: mažesnės kalbos. Automatiniai vertėjai dirba geriausiai su dažniausiai vartojamomis kalbų poromis – anglų-ispanų, anglų-prancūzų, anglų-vokiečių. Lietuvių, latvių, estų, vengrų ar kitų mažesnių kalbų vertimo kokybė vis dar gerokai atsilieka. Tai reiškia, kad mažesnių kalbų žiniasklaida gauna prastesnę technologiją – ir tai tik gilina informacinę nelygybę.
Dezinformacija ir automatinis vertimas: pavojinga kombinacija
Čia reikia kalbėti atvirai, nes ši tema dažnai nutylima. Automatiniai vertėjai gali būti – ir jau yra – naudojami dezinformacijos platinimui.
Mechanizmas paprastas: sukuriamas melagingos informacijos tekstas viena kalba, tada automatiškai išverčiamas į dešimtis kitų kalbų ir platinamas per socialinių tinklų paskyras ar netikrus naujienų puslapius. Tai, kas anksčiau reikalavo komandos vertėjų, dabar trunka minutes ir kainuoja beveik nieko. Dezinformacijos kampanijos tapo globalios ne todėl, kad atsirado daugiau žmonių, norinčių jas vykdyti, bet todėl, kad technologijos pašalino kalbos barjerą kaip natūralų filtrą.
Tyrėjai iš Stanford Internet Observatory ir kitos organizacijos, stebinčios dezinformacijos srautus, patvirtina šį modelį. Per COVID-19 pandemiją matėme, kaip melagingos informacijos apie vakcinų pavojus tekstai per kelias valandas pasirodydavo dešimtimis kalbų – ir ne todėl, kad kažkas juos vertė rankiniu būdu.
Ką tai reiškia žurnalistams ir redakcijoms? Kelias svarbias praktines pasekmes:
Pirma, tikrinant šaltinius, reikia atkreipti dėmesį į vertimo požymius. Automatiškai išversti tekstai dažnai turi subtilių stilistinių keistenybių – nenatūralios frazės, netipinė žodžių tvarka, kultūriškai neadekvatūs posakiai. Tai gali būti signalas, kad tekstas nėra originalus.
Antra, reikia atsargiai žiūrėti į šaltinius, kurie atsiranda vienu metu keliomis kalbomis su identiška struktūra. Tai klasikinis koordinuotos dezinformacijos požymis.
Trečia, faktų tikrinimo organizacijos jau kuria specializuotus įrankius, kurie gali atpažinti automatiškai išverstus tekstus. Redakcijoms verta sekti šias iniciatyvas ir integruoti tokius įrankius į savo darbo eigą.
Etika ir atsakomybė: kas atsako už mašinos klaidą
Tai klausimas, kurį žurnalistikos etikos specialistai dar tik pradeda rimtai nagrinėti. Ir jis yra tikrai svarbus.
Tradicinėje žurnalistikoje atsakomybės grandinė aiški: žurnalistas rašo, redaktorius tikrina, leidėjas publikuoja. Jei klaida – atsakomybė paskirstyta tarp žmonių. Kai į šią grandinę įeina automatinis vertėjas, kas atsako už jo klaidą?
Teisiškai situacija dar neišspręsta. Daugelyje šalių nėra aiškios reguliacijos, kaip turėtų būti žymimas automatiškai išverstas žurnalistinis turinys. Europos Sąjungos Dirbtinio intelekto aktas (AI Act) numato tam tikrus skaidrumo reikalavimus, bet specifiniai žurnalistikos standartai dar formuojasi.
Etiškai – pozicija turėtų būti aiškesnė. Jei redakcija naudoja automatinius vertimus, ji privalo:
Informuoti skaitytojus apie tai, kai turinys buvo išverstas automatiškai. Tai skaidrumo klausimas. Skaitytojas turi teisę žinoti, ar tekstas buvo verčiamas žmogaus, ar mašinos.
Prisiimti atsakomybę už galutinį tekstą nepriklausomai nuo to, kas jį vertė. „Mašina suklydo” nėra pakankamas pateisinimas – jei redakcija pasirinko naudoti tą mašiną ir nepatikrino rezultato, atsakomybė lieka žmogui.
Turėti aiškią politiką, kaip tvarkomi automatinio vertimo klaidų atvejai – kaip greitai koreguojama, kaip informuojami skaitytojai.
Kai kurios redakcijos jau eina šiuo keliu. „The Washington Post” ir keletas kitų stambių leidinių pradėjo žymėti turinį, kuris buvo apdorotas AI įrankiais. Tai geras ženklas – ir modelis, kurį verta sekti.
Kai vertimas tampa kūryba: ateities redakcija
Žiūrint į priekį, automatinių vertėjų vaidmuo žurnalistikoje tik augs – tai neabejotina. Klausimas ne ar, o kaip. Ir čia yra erdvės optimizmui, jei redakcijos elgsis protingai.
Artimiausioje ateityje labiausiai tikėtina, kad matysime hibridines sistemas, kur automatinis vertimas ir žmogaus redagavimas bus integruoti į vieną sklandų procesą. Jau dabar kuriami įrankiai, kurie ne tik verčia, bet ir pažymi vietas, kur vertimas yra nepatikimas, kur reikia žmogaus patikrinimo, kur yra kultūrinių niuansų, kurių sistema „nežino”. Tai žymiai geriau nei dabartinė situacija, kai sistema verčia ir nieko nepažymi.
Ilgesnėje perspektyvoje – galbūt dešimties ar penkiolikos metų horizonte – galima įsivaizduoti redakcijas, kurios realiu laiku teikia turinį šimtais kalbų, pritaikytą ne tik lingvistiškai, bet ir kultūriškai. Tai ne utopija – tai technologinė trajektorija, kuria einame.
Tačiau svarbiausia, ką reikia suprasti: geriausia ateities redakcija nebus ta, kuri labiausiai pasitiki mašina, bet ta, kuri geriausiai žinos, kada pasitikėti mašina ir kada – žmogumi. Automatinis vertimas yra įrankis. Kaip ir bet kuris įrankis, jo vertė priklauso nuo to, kas jį laiko rankose ir kaip naudoja.
Žurnalistika išgyvena technologinę transformaciją, kuri yra tokia pat reikšminga kaip perėjimas nuo spausdinimo mašinėlės prie kompiuterio ar nuo laikraščio prie interneto. Kiekvieną kartą buvo baimių, buvo praradimų, buvo ir naujų galimybių. Automatiniai vertėjai nėra žurnalistikos pabaiga – jie yra naujas skyrius. Ir kaip tas skyrius bus parašytas, priklauso nuo žmonių, kurie dirba šioje srityje: nuo jų sprendimų, standartų, kuriuos jie kelia sau ir savo redakcijoms, ir nuo to, ar jie sugebės išlaikyti žurnalistikos esmę – tiesą, kontekstą ir atsakomybę – net tada, kai dalis darbo atliekama algoritmo.