Slovenija

Zakaj toliko govora o DeepSeeku?

Ljubljana, 15. 02. 2025 12.33 |

PREDVIDEN ČAS BRANJA: 5 min

Avtor

Peter Aleksander Bizjak

Predstavljajte si, da zgradite umetno inteligenco, ki tekmuje s ChatGPT, in to vam uspe z manj kot enim odstotkov njegovih stroškov. Se sliši nemogoče? Točno to je storil DeepSeek. Njegova zgodba se ne nanaša le na tehnologijo: gre za inovacije pod omejitvami, kontroverzne prakse na področju zasebnosti in opozorilo za zahodne tehnološke velikane.

Šestmilijonski čudež

Ko je OpenAI porabil milijarde za razvoj svojih modelov, je postavil pričakovanje: ustvarjanje močne umetne inteligence zahteva ogromen kapital. DeepSeek je to domnevo obrnil na glavo. Za razvoj svoje je potreboval samo približno šest milijonov dolarjev.

Kako jim je to uspelo? S tako imenovano arhitekturo mešanice strokovnjakov (MoE). Pomislite na to kot na skupino strokovnjakov in ne na enega mojstra za vse. Namesto da bi za vsako nalogo aktiviral vse dele umetne inteligence, DeepSeekov model zbudi samo "strokovnjake", ki jih potrebuje.

En mesec proti večnosti

Zaradi ameriških izvoznih omejitev DeepSeek ni mogel uporabljati najnovejših čipov NVIDIA, ki poganjajo večino zahodnih sistemov umetne inteligence. Namesto tega so dobili H800 – namerno oslabljeno različico, zasnovano za kitajski trg. Ko govorimo o strojni opremi na takšnem nivoju, so vprašanja popolnoma drugačna, kot smo jih vajeni potrošniki strojne opreme za lastno uporabo. Tu ne gre za dilemo "MacBook" ali "gaming laptop".

Samo za primer, da dobite realno sliko: usposabljanje GPT-3 na enem samem grafičnem procesorju NVIDIA Tesla V100 GPU bi trajalo 355 let. Raziskovalci so izračunali, da bi OpenAI z uporabo 1024 grafičnih procesorjev A100 lahko usposobil GPT-3 v samo 34 dneh.

Izbira pravega modela grafične procesne enote (graphics processing unit – GPU), njihovega števila in načina uporabe predstavlja izjemno pomemben faktor. Se pravi, da bi omejitev GPU-jev morda bila blagoslov. Delo z manj zmogljivo strojno opremo je prisililo DeepSeek, da je vse optimiziral. Zato je njegov uspeh še toliko bolj impresiven.

Cena uspeha na plečih zasebnosti

DeepSeekov vzpon ni minil brez polemik. V tednih po njegovi uvedbi so zagovorniki zasebnosti opozorili na neprimerno prakso upravljanja s podatki. Zbira veliko občutljivih uporabniških podatkov, vse pa hrani na Kitajskem.

Tukaj je resničnost zaskrbljujoča. Po kitajski zakonodaji mora vsako podjetje predati vse podatke, ki jih zahteva vlada, brez vprašanj. Brez sodnih odredb. Ni poročil o preglednosti. Brez pritožb. In ne gre samo za to, kaj danes vtipkate v DeepSeek – kitajska zakonodaja zahteva, da podjetja te podatke hranijo dlje časa, s čimer ustvarijo trajen digitalni odtis, ki je kitajskim oblastem dostopen kadar koli.

Pomislite, kaj to pomeni: vsaka poslovna strategija, o kateri razmišljate, vsak del kode, ki jo analizirate, vsak dokument, ki ga povzamete, vse to je potencialno dostopno kitajski vladi. Za podjetja bi to lahko pomenilo razkritje poslovnih skrivnosti. Za posameznike bi to lahko pomenilo, da imajo osebne pogovore shranjene na strežnikih, kjer jim zahodni zakoni o zasebnosti ne nudijo nobene zaščite.

Peter Aleksander Bizjak FOTO: Homopolitikus

Prepovedi se vrstijo

Odziv? Glede na to, da govorimo o politiki, je zelo hiter. Italija je postala prva država, ki je – zaradi pomislekov o zasebnosti – v celoti prepovedala DeepSeek. Tajvan, Avstralija in številne ameriške vladne agencije so temu sledile. Tudi indijsko finančno ministrstvo je svojim zaposlenim prepovedalo uporabo te aplikacije.

Toda skrbi nas lahko, da jo milijoni uporabnikov po vsem svetu še naprej dnevno uporabljajo, ker se bodisi ne zavedajo tveganj bodisi jih ne zanima, kje končajo njihovi podatki.

Polemika o OpenAI

Medtem ko je DeepSeek pridobival uporabniško bazo, je OpenAI "vrgel bombo" in kitajsko podjetje obtožil, da je njihovo bazo uporabilo za usposabljanje svoje. OpenAI trdi, da je našel dokaze o "destilaciji modela". V bistvu je DeepSeek uporabil ChatGPT za poučevanje svoje umetne inteligence.

Ironija je tukaj velika. OpenAI se sooča s stalnimi kritikami, ker brez dovoljenja uri svoje modele na avtorsko zaščitenem gradivu. Pri obsegu sodobne umetne inteligence se je skoraj nemogoče popolnoma izogniti takšnim napačnim korakom. Vendar obstaja razlika med nenamerno vključitvijo zaščitene vsebine v podatke o usposabljanju in namerno uporabo umetne inteligence drugega podjetja za zagon lastne.

Če so obtožbe OpenAI resnične, začne DeepSeekov "šestmilijonski čudež" izgledati manj čudežno in bolj kot sofisticirana oblika kraje intelektualne lastnine. In čeprav ta praksa ni edinstvena za kitajska podjetja, se ujema z znanim vzorcem v kitajskem tehnološkem sektorju, kjer hiter razvoj pogosto prihaja na račun pravic intelektualne lastnine.

Kaj počne Evropa?

Medtem pa evropski odgovor na ta razvoj, pobuda OpenEuroLLM, kaže, kako zahtevno je tekmovati z umetno inteligenco. Kljub znatnemu financiranju in ambicioznim ciljem projekt ostaja večinoma teoretičen.

Soočimo se z resničnostjo: medtem ko so ameriška podjetja začela komercializirati umetno inteligenco in ko kitajska podjetja, kot je DeepSeek, iščejo kreativne (čeprav sporne) načine za konkurenčnost, se zdi, da je Evropa zadovoljna s svojo flegmatičnostjo. Da, imamo en dober primer, Mistral AI, vendar ena zgodba o uspehu ni dovolj.

To je še posebej frustrirajoče, ker ima Evropa vse sestavine za vodilno vlogo na področju umetne inteligence: izobraževalne ustanove svetovnega kova, trdne pravne okvire (čeprav jih je treba izboljšati) in globoko zavezanost razvoju etične tehnologije. Lahko bi ustvarili umetno inteligenco, ki ni samo zmogljiva, ampak je tudi varna, poštena in pregledna. Tega niti ZDA niti Kitajska nista dosegli v celoti in verjetno nikoli ne bosta.

Toda namesto da bi izkoristili te prednosti, smo obtičali v neskončnih razpravah in teoretičnih okvirih. Zasebni sektor se mora okrepiti. Potrebujemo več podjetij, ki so pripravljena tvegati, več vlagateljev, pripravljenih podpreti evropske pobude za umetno inteligenco, in večje uresničevanje naših potencialov. Ker trenutno ne samo da zamujamo priložnosti – prihodnost umetne inteligence celo prepuščamo drugim.

DEEPSEEK UMETNA INTELIGENCA KITAJSKA ZDA EU