Companiile chineze de top își antrenează modelele de inteligență artificială în străinătate pentru a avea acces la cipurile Nvidia și a ocoli eforturile SUA de a împiedica dezvoltarea acestei tehnologii puternice.
Alibaba și ByteDance se numără printre grupurile tehnologice care își antrenează cele mai recente modele lingvistice de mari dimensiuni în centrele de date din sud-estul Asiei, potrivit surselor Financial Times. Acestea au afirmat că a existat o creștere constantă a pregătirii în locații offshore, după ce Administrația Trump a decis în aprilie să restricționeze vânzările de H20, semiconductori Nvidia destinați exclusiv pieței chineze.
„Este o alegere evidentă să venim aici”, a declarat un operator de centru de date din Singapore. „Ai nevoie de cele mai bune cipuri pentru a pregăti cele mai avansate modele și totul este conform legii”, a adăugat el.
În ultimul an, modelele Qwen de la Alibaba și Doubao de la ByteDance au devenit printre cele mai performante LLM-uri la nivel mondial. Qwen a devenit, de asemenea, larg adoptat în afara Chinei de către dezvoltatori, deoarece este un model „deschis” disponibil gratuit.
Clusterele de centre de date au cunoscut o creștere rapidă în Singapore și Malaezia, alimentate de cererea din China. Multe dintre aceste centre de date sunt echipate cu produse Nvidia de ultimă generație, similare cu cele utilizate de marile grupuri tehnologice americane pentru a antrena LLM-urile.
Potrivit celor familiarizați cu această practică, companiile chineze semnează de obicei un contract de închiriere pentru a utiliza centrele de date din străinătate deținute și operate de entități non-chineze. Acest lucru este conform cu controalele de export ale SUA, deoarece „regula de difuzare” din era Biden, concepută pentru a elimina această lacună, a fost eliminată de președintele american Donald Trump la începutul acestui an.
O excepție este DeepSeek, producător de modele AI de înaltă calitate și cu costuri reduse, care este antrenat pe plan intern, potrivit persoanelor familiarizate cu acest subiect.
Compania a construit un cluster considerabil de cipuri Nvidia înainte ca interdicțiile de export ale SUA să intre în vigoare, potrivit persoanelor familiarizate cu acest subiect. De asemenea, colaborează îndeaproape cu producătorii interni de cipuri, conduși de Huawei, pentru a optimiza și dezvolta următoarea generație de cipuri AI chinezești, potrivit acelor persoane.
Huawei are o echipă de ingineri staționați la sediul DeepSeek din Hangzhou. Compania consideră parteneriatul cu DeepSeek ca un efort strategic de a-și promova sistemele de semiconductori și software pentru a fi adoptate pentru instruirea AI în toată țara.
Instruirea LLM-urilor necesită o putere de calcul enormă pentru a procesa seturi de date masive, ceea ce face ca majoritatea grupurilor chineze să prefere produsele avansate ale Nvidia pentru această sarcină.
Pe lângă instruire, companiile chineze de tehnologie utilizează și centre de date din Asia de Sud-Est pentru a deservi clienții lor din străinătate, întrucât Alibaba și ByteDance încearcă să-și mărească cota pe piața globală de cloud computing. Companiile chineze extind, de asemenea, accesul la centrele de date din alte regiuni, cum ar fi Orientul Mijlociu.
O constrângere este faptul că giganții tehnologici chinezi nu au voie să transfere date private în afara țării. Acest lucru înseamnă că, pentru a personaliza un model de IA pe baza datelor specifice furnizate de un client local, instruirea trebuie să rămână în China, potrivit specialiștilor din industrie.
(Citește și: „Studiu KPMG: 71% dintre CEO plasează inteligența artificială printre principalele lor priorități de investiție”)
***