Znanost in tehnologija

Projekt EMBEDDIA: Brezplačna orodja za uvajanje umetne inteligence v medijih

Ljubljana, 11. 12. 2021 07.00 |

PREDVIDEN ČAS BRANJA: 4 min
Avtor
Daniel Fazlić
Komentarji
6

V poplavi informacij, aktivnem udejstvovanju na spletu in omejenih virih se vse več novinarskih redakcij nagiba k uporabi umetne inteligence, da bi določene stvari avtomatizirali. Programi že obstajajo, a so bolj kot ne omejeni na svetovne jezike. Skupina raziskovalcev v projektu EMBEDDIA pa se je usmerila na manj številčne jezike, med drugim tudi slovenščino.

Umetna inteligenca
Umetna inteligenca FOTO: Dreamstime

Večina programov, ki že danes obstajajo, ne ustvarjajo vsebine iz nič, ampak s pomočjo umetne inteligence ustvarjajo vsebine, ki so bodisi ustvarjene v drugih jezikih ali fragmentirane bodisi je množica podatkov tako velika, da bi bili potrebni številni resursi, da bi iz njih potegnili bistvo. Ustvarjalci so še pred začetkom ustvarjanja programov preverili, kaj novinarske redakcije potrebujejo za svoje delovanje. Umetna inteligenca namreč ni inteligenca v pravem pomenu, saj program ne more sam ustvariti nekaj, kar ni bil naučen. Človeško znanje, delo in razumevanje problema je tako ključno za programiranje in spoznavanje tistih težav, ki bi lahko program naredile neuporabnega. 

Dr. Marko Milosavljević, ki je eden od členov v ustvarjanju teh programov, je rekel, da so obiskali več novinarskih redakcij in opravili več intervjujev tako z novinarji kot uredniki. "Obiskali in debatirali smo tudi s posamezniki v New York Timesu, Reutersu, BBC, Guardianu …", je dejal Milosavljevič. Sodelovali so z Univerzo v Edinburghu in Helsinkih, s Queen Mary iz Londona, z La Rochelle in Inštitutom Jožefa Stefana. Celoten razvoj je financiran s strani Evropske unije, tako da so orodja brezplačna in na voljo vsem. 

Za ogled potrebujemo tvojo privolitev za vstavljanje vsebin družbenih omrežij in tretjih ponudnikov.

Senja Pollak iz Instituta Jožef Stefan, ena ključnih oseb pri razvoju tega projekta, je dejala, da so se osredotočili predvsem na slovenščino, estonščino, hrvaščino, finščino in latviščino. Projekt se je začel leta 2019 in bo potekal vse do leta 2022, na predstavitvi pa so predstavili prve (beta) variante programov, ki bodo prosto dostopni. Tako razvijajo programe za analizo komentarjev, torej iskanje sovražnega govora in delivcev lažnih novic. Drugi tovrsten program se bo osredotočal predvsem na analizo novic in njihov pomen, pa tudi ustvarjanje novic. 

Pollak je povedala, da so se v zadnjih letih precej razvile tehnologije na osnovi globokih nevronskih mrež in tudi vektorsko embedanje, kjer s pomočjo določenih kontekstualnih smislov lahko ima beseda drugačen pomen. Gre tudi za to, da lahko program razume določene povezave med vsebinskimi sopomenkami – delnimi. Tako ima lahko v kontekstu postavljanja jezika dvojica stric in teta podoben pomen kot kralj in kraljica. 

Prav tako določeni programi določajo ključne besede oziroma ključno postavko neke vsebine, ki se pojavlja v članku. Nekateri mediji so tudi želeli, da bi lahko preverili ujemanje računalniškega določanja ključnih besed s tistimi, ki so ga določili ljudje. Gre tudi za način učenja in usklajevanja ključnih besed, ki jih uporabljajo podobne vsebine in se lahko poveže članke s podobnimi vsebinami. Računalniško voden proces bi vsaj v teoriji to naredil veliko hitreje in bolj natančno ter s tem poskrbel za boljšo povezanost člankov. 

Podrobnejša pojasnila o orodjih si lahko pogledate na posnetku (v angleščini).

Za ogled potrebujemo tvojo privolitev za vstavljanje vsebin družbenih omrežij in tretjih ponudnikov.

Pri analizah samih novic so naredili še korak naprej, saj so s pomočjo analize sentimenta, ki ga je možno razviti ob branju članka, lahko nato ponudili članke, ki razložijo določeno ozadje zgodbe, ki jo trenutno berejo. Vsebinsko je to možno tudi uporabiti pri iskanju kvalitativnih vsebin – podobno, kot že imajo programe Google in še tisti ki, lahko določajo vrednost novicam na podlagi trending faktorja. S temi programi lahko vidijo, v kakšnem kontekstu se določene vsebine pojavljajo in izpostavijo mrežo besed, ki se pojavljajo skupaj z njimi. Kako bi to izgledalo v praksi: pred 2020 se o testiranju ni veliko govorilo – opaziti bi bilo predvsem možno v množici besed, ki so povezane s spolno prenosljivimi boleznimi. Po marcu 2020 pa vse bolj v povezavi s koronavirusom – in s pomočjo teh povezav je mogoče prepoznati vsebinske vzorce. 

Iz podobnih primerov in razvoja razumevanja samega jezika, njegovega konteksta in uporabe, so raziskovalci razvili tudi orodje za moderiranje komentarjev. Naloga tega je, podobno kot pri vseh teh orodij, da se avtomatizira določen del vsakdanjega dela, ki ni težaven, a je dolgotrajen in tako novinarjem pridobi več časa za ustvarjanje resnejših raziskovalnih tem. Tudi pisanje člankov, ki bi jih počeli programi, je povezano z isto logiko. Številni članki so narejeni precej tehnično suhoparno, pravo novinarsko delo ni potrebno – gre predvsem za hitre novice, ki predstavljajo pomemben del objave novic. Takšni primeri bi recimo bili poročilo statističnega urada, vremenske razmere, prometne informacije – predvsem takšno orodje pride prav v primerih, ko gre za opisovanje tehnično bogatih vsebin. 

UI Vsebina ustvarjena brez generativne umetne inteligence.
  • Powered, bencinska kosilnica
  • Lounge naslanjač Relax
  • Lounge set Maja      
  • Gardena, robotska kosilnica      
  • žar
  •  Vrtna hiška, lesena, mikka
  • Scheppach visokotlačni
  • Lounge set Alex
  • Karcher visokotlačni
  • Villager robotska kosilnica
  • paviljon
  • sedežna fiesta

KOMENTARJI (6)

Opozorilo: 297. členu Kazenskega zakonika je posameznik kazensko odgovoren za javno spodbujanje sovraštva, nasilja ali nestrpnosti.

PATRIOT-SLO
11. 12. 2021 18.49
Umetne inteligence v medijih? A to pomeni, da bo stroj sam se izmišljal in delal poročila ali bo iz poročil cenzuriral tisto kar mu nebo všeč? Ne eno ne drugo si ne želimo.
User1538643
11. 12. 2021 09.42
+3
Ko jim bo UI začela deliti odpovedi... 😉
PATRIOT-SLO
11. 12. 2021 18.50
Ko bo delila smrtne obsodbe bo še bolj zanimivo,.in narod bo kimal z glavo kako je to fajn.
Sventevith
11. 12. 2021 09.41
+2
Novice so že zdaj take, da bi rekel, da so boti na delu. Zdaj je jasno, kar pravim že dolgo. Novinarjev nihče več ne bo potreboval. Tako, kot ne marsikaj drugega. Ne boste verjeli, a tudi zdravniki bodo izpadli iz novega sistema. Pridejo aplikacije, hehe
Ramzess
11. 12. 2021 15.46
PATRIOT-SLO
11. 12. 2021 18.53
+1
Da, sedaj bodo zdravniki zdravili na daljavo,.kasneje bo to delala sama aplikacija po tristo klikih,..še v ambulanto ti nebo treba, ker ti bodo zdravilo (ali strup) spuščali na daljavo, preko čipa ali kakega vsadka. Ko bo pa AI prevzela zdravljenje (beri pogubljanje) boste spet kričali kako je to fajn, kajne?