
Večina programov, ki že danes obstajajo, ne ustvarjajo vsebine iz nič, ampak s pomočjo umetne inteligence ustvarjajo vsebine, ki so bodisi ustvarjene v drugih jezikih ali fragmentirane bodisi je množica podatkov tako velika, da bi bili potrebni številni resursi, da bi iz njih potegnili bistvo. Ustvarjalci so še pred začetkom ustvarjanja programov preverili, kaj novinarske redakcije potrebujejo za svoje delovanje. Umetna inteligenca namreč ni inteligenca v pravem pomenu, saj program ne more sam ustvariti nekaj, kar ni bil naučen. Človeško znanje, delo in razumevanje problema je tako ključno za programiranje in spoznavanje tistih težav, ki bi lahko program naredile neuporabnega.
Dr. Marko Milosavljević, ki je eden od členov v ustvarjanju teh programov, je rekel, da so obiskali več novinarskih redakcij in opravili več intervjujev tako z novinarji kot uredniki. "Obiskali in debatirali smo tudi s posamezniki v New York Timesu, Reutersu, BBC, Guardianu …", je dejal Milosavljevič. Sodelovali so z Univerzo v Edinburghu in Helsinkih, s Queen Mary iz Londona, z La Rochelle in Inštitutom Jožefa Stefana. Celoten razvoj je financiran s strani Evropske unije, tako da so orodja brezplačna in na voljo vsem.
Senja Pollak iz Instituta Jožef Stefan, ena ključnih oseb pri razvoju tega projekta, je dejala, da so se osredotočili predvsem na slovenščino, estonščino, hrvaščino, finščino in latviščino. Projekt se je začel leta 2019 in bo potekal vse do leta 2022, na predstavitvi pa so predstavili prve (beta) variante programov, ki bodo prosto dostopni. Tako razvijajo programe za analizo komentarjev, torej iskanje sovražnega govora in delivcev lažnih novic. Drugi tovrsten program se bo osredotočal predvsem na analizo novic in njihov pomen, pa tudi ustvarjanje novic.
Pollak je povedala, da so se v zadnjih letih precej razvile tehnologije na osnovi globokih nevronskih mrež in tudi vektorsko embedanje, kjer s pomočjo določenih kontekstualnih smislov lahko ima beseda drugačen pomen. Gre tudi za to, da lahko program razume določene povezave med vsebinskimi sopomenkami – delnimi. Tako ima lahko v kontekstu postavljanja jezika dvojica stric in teta podoben pomen kot kralj in kraljica.
Prav tako določeni programi določajo ključne besede oziroma ključno postavko neke vsebine, ki se pojavlja v članku. Nekateri mediji so tudi želeli, da bi lahko preverili ujemanje računalniškega določanja ključnih besed s tistimi, ki so ga določili ljudje. Gre tudi za način učenja in usklajevanja ključnih besed, ki jih uporabljajo podobne vsebine in se lahko poveže članke s podobnimi vsebinami. Računalniško voden proces bi vsaj v teoriji to naredil veliko hitreje in bolj natančno ter s tem poskrbel za boljšo povezanost člankov.
Podrobnejša pojasnila o orodjih si lahko pogledate na posnetku (v angleščini).
Pri analizah samih novic so naredili še korak naprej, saj so s pomočjo analize sentimenta, ki ga je možno razviti ob branju članka, lahko nato ponudili članke, ki razložijo določeno ozadje zgodbe, ki jo trenutno berejo. Vsebinsko je to možno tudi uporabiti pri iskanju kvalitativnih vsebin – podobno, kot že imajo programe Google in še tisti ki, lahko določajo vrednost novicam na podlagi trending faktorja. S temi programi lahko vidijo, v kakšnem kontekstu se določene vsebine pojavljajo in izpostavijo mrežo besed, ki se pojavljajo skupaj z njimi. Kako bi to izgledalo v praksi: pred 2020 se o testiranju ni veliko govorilo – opaziti bi bilo predvsem možno v množici besed, ki so povezane s spolno prenosljivimi boleznimi. Po marcu 2020 pa vse bolj v povezavi s koronavirusom – in s pomočjo teh povezav je mogoče prepoznati vsebinske vzorce.
Iz podobnih primerov in razvoja razumevanja samega jezika, njegovega konteksta in uporabe, so raziskovalci razvili tudi orodje za moderiranje komentarjev. Naloga tega je, podobno kot pri vseh teh orodij, da se avtomatizira določen del vsakdanjega dela, ki ni težaven, a je dolgotrajen in tako novinarjem pridobi več časa za ustvarjanje resnejših raziskovalnih tem. Tudi pisanje člankov, ki bi jih počeli programi, je povezano z isto logiko. Številni članki so narejeni precej tehnično suhoparno, pravo novinarsko delo ni potrebno – gre predvsem za hitre novice, ki predstavljajo pomemben del objave novic. Takšni primeri bi recimo bili poročilo statističnega urada, vremenske razmere, prometne informacije – predvsem takšno orodje pride prav v primerih, ko gre za opisovanje tehnično bogatih vsebin.
KOMENTARJI (6)
Opozorilo: 297. členu Kazenskega zakonika je posameznik kazensko odgovoren za javno spodbujanje sovraštva, nasilja ali nestrpnosti.