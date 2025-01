DeepSeek, startup-ul chinez de inteligență artificială (AI) care aproape că a revoluționat printr-un singur „foc” gândirea convențională despre costurile de dezvoltare a tehnologiei, a produs uimire în rândurile comunității americane de AI. Modelul DeepSeek R1 al companiei chineze este lăudat zilele acestea drept „momentul Sputnik în domeniul intelegenței artificiale” datorită faptului că modelul are abilități de raționalizare și rezolvare a unor probleme superioare.

Chinezii de la DeepSeek susțin că R1 a egalat capacitățile modelului GPT-4 al OpenAI, cu un cost al dezvoltării de doar 5 milioane de dolari. Lansarea modelului chinezesc de AI a declanșat o dezbatere intensă în industria AI, în condițiile în care procesul de dezvoltare a presupus până acum investiții imense în centre de date și resurse de energie pentru rularea și antrenarea sistemelor AI.

Comparativ cu sistemele vestice, modelul DeepSeek R1 nu folosește toți parametri la un nivel constant, ceea ce reduce consumul de energie, ci ține mare parte din parametri în rezervă pentru când are nevoie să îi folosească, specific. În funcție de cerințe. Totodată, DeepSeek susține că a folosit mult mai puține chip-uri, nu doar chip-uri mai vechi, iar faptul că modelele sunt open-source (pot fi downloadate și reproduse sau îmbunătățite) contrastează puternic cu abordarea americană, axată pe comercializare și profitabilitate.

În urma apariţiei modelului chinez de AI, investitorii de pe Wall Street au vândut puternic acțiuni ale companiilor tehnologice, în mod special în ziua de luni, îngrijoraţi că acest model ar putea ameninţa dominaţia pe piaţă a liderilor AI din SUA, în special având în vedere faptul că modelul a necesitat costuri de capital extrem de mici, care nu ar mai fi justificate în SUA și ar putea fi regândite.

Asta ar putea afecta semnificativ profiturile companiilor de tip Nvidia, care vând generații noi de semiconductori la marje de profitabilitate extrem de înalte. Între timp, acțiunile sectorului tehnologic din SUA și-au revenit, după scăderea de 3,1% a indicelui Nasdaq de luni.

Ascensiunea DeepSeek

Publicația platformer.news face o trecere în revistă a principalelor motive de îngrijorare legate de DeepSeek, dar și a principalelor motive pentru care competiția vestică cu companiile chineze pe zona de AI este benefică și chiar binevenită.

Potrivit sursei citate, pe măsură ce informațiile despre performanțele DeepSeek s-au răspândit în weekend, acestea au devenit un fel de test Rorschach. Deși toată lumea este impresionată că DeepSeek a construit cel mai bun model open-source disponibil, cheltuind foarte puțini bani raportat la rivalii săi, opiniile despre semnificația sa pe termen lung sunt foarte variate.

DeepSeek pare să fi întărit anumite idei: pentru scepticii AI, care consideră costurile inteligenței artificiale drept prea mari pentru a fi recuperate vreodată, succesul DeepSeek este o dovadă a risipei financiare a marilor firme din Silicon Valley. Pentru optimiștii AI, care cred că America trebuie să construiască inteligența artificială generală (AGI – Artificial General Intelligence = inteligență artificială superioară inteligenței umane) înaintea oricui din motive de securitate națională, DeepSeek este un avertisment serios și un îndemn la acțiune. În același timp, pentru cercetătorii în siguranța AI, care s-au temut mult timp că încadrarea AI drept o cursă a armelor crește riscul de a scăpa tehnologia de sub control și de a provoca daune catastrofale, DeepSeek este coșmarul pe care l-au așteptat, arată analiza platformer.news.

Pentru specialiștii în AI, DeepSeek este o dezvoltare importantă care necesită atenție continuă, dar, în același timp, apariția unui model chinezesc de AI puternic și ieftin nu schimbă foarte mult dinamica competiției la nivel global.

Motivele de îngrijorare: 1. Nimeni nu știe care este planul pe termen lung al DeepSeek

DeepSeek a fost creat de un fond de investiții chinez cu 10 ani de experiență, numit High-Flyer, co-fondat de Liang Wenfeng, care este și CEO-ul DeepSeek și despre care se speculează că are legături puternice cu Partidul Comunist Chinez. High-Flyer a dezvoltat inițial algoritmi AI pentru tranzacționare de valori mobiliare, iar în 2023 a înființat un așa-numit laborator pentru a construi modele AI cu utilizare generală.

În decurs de aproximativ un an, a realizat o serie de inovații tehnice în construirea modelelor de limbaj de mare dimensiune. Misiunea sa declarată, așa cum apare pe profilul său de X, este să „descifreze prin curiozitate misterele AGI (inteligența artificială generală)”. Compania s-a angajat să ofere modelele sale open-source și le-a pus la dispoziția dezvoltatorilor de AI.

Pe moment, DeepSeek nu pare să aibă un model de afaceri care să corespundă ambițiilor sale. Pentru majoritatea marilor laboratoare americane de AI, modelul de afaceri (încă nerealizat) este să dezvolte cel mai bun serviciu și să îl vândă pentru profit. Până acum, DeepSeek s-a poziționat ca un fel de ofertă altruistă.

Însă acest lucru s-ar putea schimba oricând, iar DeepSeek ar putea introduce abonamente sau să impună noi restricții asupra API-urilor (platformelor de programare) pentru dezvoltatori. Alți specialiști consultați de platformer.news sunt de părere că firma chineză ar putea folosi datele utilizatorilor și să le ofere fondului de investiții pentru informații de tranzacționare, sau, mai rău, unor alți actori din China.

Totodată, la un moment dat, este de așteptat ca guvernul chinez să intervină în dezvoltarea companiei, care oferă practic un model de AI puternic oricui, posibil chiar inclusiv unor potențiali adversari ai Chinei.

Numai faptul că DeepSeek nu și-a clarificat ambițiile reprezintă un motiv de îngrijorare pentru specialiștii în AI consultați de sursa citată.

2. Marile laboratoare de AI vestice nu par să mai aibă un avantaj prea mare

Un factor cheie care se pierde în discuțiile despre DeepSeek până acum este faptul că modelele sale impresionante, în special v3 și r1, au fost construite pe baza inovațiilor americane. Laboratoarele americane de AI au dezvoltat arhitectura de bază pentru modelele de limbaj de mare dimensiune (LLMs) și modelele de raționament mai noi. Ceea ce a făcut DeepSeek este să optimizeze inteligent acea arhitectură folosind hardware vechi și mai puțină putere de calcul.

În trecut, adică în epoca GPT-3, rivalilor OpenAI le lua luni de zile sau chiar mai mult pentru a absorbi inovațiile (reverse-engineering) din domeniul AI și să le implementeze. Pentru anumite modele a durat chiar un an ca inovațiile să ajungă să fie preluate de alte companii de AI.

DeepSeek a arătat că laboratoarele open-source au devenit mult mai bune la reverse-engineering și că avantajul competitiv al firmelor americane de AI poate fi eliminat relativ rapid. Aceasta este o problemă foarte mare dacă principala afacere este vânzarea de abonamente la modele inteligente către dezvoltatori și firme. În plus, DeepSeek pare să ofere rezultate superioare la costuri mai mici de utilizare.

Pentru laboratoarele de AI din Vest, aceasta este o problemă de afaceri. Care ar putea să se transforme și într-o problemă geopolitică: inovațiile DeepSeek arată că nu va prea există o posibilitate de a împiedica accesul la AI al unor actori rău intenționați, cum ar fi state totalitare, națiuni care nu respectă reglementările internaționale sau grupări teroriste.

După cum a afirmat Jack Clark, cofondatorul Anthropic, „DeepSeek înseamnă că proliferarea AI este garantată”.

3. Succesul DeepSeek va intensifica dezvoltarea tehnologiei AI de o factură echivalentă cu o cursă a înarmării

Pentru marii investitori, dezvoltarea AI s-a încadrat în ultimii ani, la nivel de scop, drept concurs împotriva Chinei.

Investitorilor le place această încadrare din mai multe motive, arată analiza platformer.news: ea se bazează pe o frică rațională, că un guvern autoritar va crea o inteligență supraumană înaintea democrațiilor și o va folosi împotriva lor.

Această încadrare este, de asemenea, menită să servească drept muniție împotriva reglementărilor care ar putea încetini progresul AI și afecta, eventual, rentabilitatea portofoliilor investitorilor. Totodată, un interes major al încadrării cursei AI drept o cursă a înarmării este cel pentru includerea soluțiilor AI în domniul tehnologiei militare, de exemplu la drone sau avioane militare inteligente.

4. Siguranța AI este ignorată

Platformer.news scoate în evidență faptul că firmele americane de AI au încercat până acum să dezvolte modele de AI sigure. DeepSeek, pe de altă parte, nu a oferit niciun fel de informații despre siguranța modelelor sale de AI, iar până acum nu există date publice despre persoane care să aibă sarcini, în interiorul companiei, pe zona de siguranță în AI.

Pentru așa-numiții acceleraționiști din firmele americane (care susțin dezvoltarea rapidă a tehnologiei, fără considerații pentru siguranță), acesta ar putea fi un motiv pentru să renunțe la preocupările de dezvoltare în siguranță a tehnologiei, sau cel puțin să reducă investițiile în acest domeniu.

„Este important să ne amintim că toate cele mai importante probleme de siguranță AI rămân nerezolvate. Dacă vreunul dintre laboratoarele care dezvoltă AI pentru profit ar inventa și ar lansa brusc o inteligență supraumană, nu există nicio modalitate de a ne asigura că ea este aliniată cu valorile sau dorințele umane și niciun plan pentru ce să facem în continuare. Administrația Biden a impus unele restricții blânde asupra laboratoarelor americane de AI, printr-un ordin executiv, dar Trump l-a abrogat în prima zi de mandat”, arată sursa citată

Motivele pentru a ne calma: 1. Lumea se aștepta la apariția unor modele puternice, open-source

Era cumva de așteptat ca firmele care dezvoltă modele open-source de AI vor reuși să replice tot ce au realizat marile firme, ceea ce era normal să ducă la o eficientizare a costurilor pentru antrenare și rulare a modelelor AI.

Ethan Mollick, profesor la Wharton School of the University of Pennsylvania, a remarcat în weekend că „costurile pentru inteligența de nivel GPT-4 au scăzut de 1000 de ori în ultimele 18 luni”.

Din acest motiv, scrie el, „o scădere de 95% a prețurilor modelelor de raționament nu pare să fie ceva care va distruge firmele americane”.

Totodată, publicația americană mai punctează că și Google a lansat, acum doar 6 zile, un model propriu de AI cu abilități de raționament, model foarte ieftin, construit pe tehnici similare. Singura diferență a fost că modelul nu a fost open-source și nu a fost chinezesc.

De asemenea, platformer.news arată că oricine trimite aceeași întrebare către ChatGPT, Claude sau Gemini va avea surpriza că toate cele 3 modele oferă aproape același răspuns, la un nivel de acuratețe foarte bun.

2. Companiile tech din SUA pot găsi încă utilizări bune pentru toate cheltuielile de capital cu AI

Companiile tech americane plănuiesc să cheltuiască zeci de miliarde de dolari pentru a construi noi centre de date care să servească nevoilor lor de AI. O întrebare pe care mulți oameni pun este dacă DeepSeek va face toate aceste investiții inutile.

„Dacă poți construi un model de top cu hardware vechi, care este rostul? Rostul este să (1) antrenezi modele mai puternice și să explorezi tehnici pe care dezvoltatorii open-source nu le-au copiat încă; și (2) să servești cererea pe care acele modele mai puternice și mai capabile o generează. Deși o mare parte a discuțiilor despre AI din ultimele șase luni s-au învârtit în jurul blocajului creat de lipsa de chipuri pentru antrenarea de modele noi, adevăratul blocaj este că nimeni nu are atâta putere de calcul cât ar dori”, mai arată sursa citată.

3. Controlul exporturilor va ajuta, dar pe termen mediu și lung

Unii observatori au afirmat că progresul DeepSeek arată că restricțiile administrației Biden privind exportul de chipuri au eșuat. Însă, după cum arată specialiștii, aceste controale de export sunt relativ noi, ceea ce înseamnă că au nevoie de mai mult timp pentru a avea un impact.

Un efect principal al controalelor de export este că China ar trebui să aibă mai puțină putere de calcul decât Statele Unite pentru o perioadă de timp. Asta înseamnă că, chiar dacă companiile chineze precum DeepSeek lansează modele mai puternice, China nu va putea să le implementeze la scară largă așa cum ar dori.

Atingerea măcar a unui nivel egal de putere de calcul este esențială pentru inventarea unor sisteme AI mai puternice.

După cum a spus recent Miles Brundage, fost cercetător la OpenAI: „Există tot felul de modalități de a transforma puterea de calcul în rezultate mai bune, iar companiile americane sunt acum într-o poziție mai bună să facă asta datorită volumului și cantității mai mari de chipuri”.

4. Laboratoarele americane de AI sunt încă la conducere

Inovațiile DeepSeek contribuie semnificativ la reducerea costurilor și la accesibilitatea sistemelor AI la care avem acces. Dar, în măsura în care ele reprezintă descoperiri conceptuale, acestea doar vor ajuta la optimizarea tehnologiei pe care OpenAI și alții au inventat-o primii. Poate exista o valoare uriașă în optimizare, iar companiile americane (Meta de exemplu) încearcă deja să replice rezultatele DeepSeek.

