DeepSeek a devenit viral: Tot ce trebuie să știi despre aplicația chatbot cu inteligență artificială

DeepSeek: Tot ce trebuie să știi despre aplicația chatbot cu inteligență artificială

DeepSeek a devenit viral.

 

Laboratorul chinez de inteligență artificială DeepSeek a intrat în conștiința publicului larg la începutului anului 2025, după ce  aplicația sa de chatbot a urcat în fruntea clasamentelor Apple App Store (și Google Play). Modelele de inteligență artificială ale DeepSeek, care au fost antrenate folosind tehnici eficiente din punct de vedere al calculului,  i-au determinat pe analiștii de pe Wall Street  –  și pe cei din domeniul tehnologiei  – să se întrebe dacă SUA își pot menține poziția de lider în cursa inteligenței artificiale și dacă se va susține cererea de cipuri de inteligență artificială.

 

Dar de unde a apărut DeepSeek și cum a ajuns atât de repede la faimă internațională?

 

Originile traderilor DeepSeek

 

DeepSeek este susținută de High-Flyer Capital Management, un fond speculativ cantitativ chinezesc care folosește inteligența artificială pentru a-și informa deciziile de tranzacționare.

 

Liang Wenfeng, pasionat de inteligență artificială, a co-fondat High-Flyer în 2015. Wenfeng, care se pare că a început să se implice în tranzacționare în timp ce era student la Universitatea Zhejiang, a lansat High-Flyer Capital Management ca fond speculativ în 2019, axat pe dezvoltarea și implementarea algoritmilor de inteligență artificială.

 

În 2023, High-Flyer a lansat DeepSeek ca un laborator dedicat cercetării instrumentelor de inteligență artificială, separat de activitatea sa financiară. Având High-Flyer ca unul dintre investitorii săi, laboratorul s-a transformat în propria companie, numită tot DeepSeek.

 

Încă din prima zi, DeepSeek și-a construit propriile clustere de centre de date pentru antrenarea modelelor. Dar, la fel ca alte companii de inteligență artificială din China, DeepSeek a fost afectată de interdicțiile americane de export de hardware. Pentru a antrena unul dintre modelele sale mai recente, compania a fost obligată să utilizeze cipuri Nvidia H800, o versiune mai puțin puternică a cipului H100, disponibil companiilor americane.

 

Se spune că echipa tehnică a DeepSeek este formată din tineri. Compania recrutează agresiv cercetători cu doctorat în inteligență artificială de la universități chineze de top. DeepSeek angajează, de asemenea, persoane fără nicio pregătire în informatică pentru a-și ajuta tehnicienii să înțeleagă mai bine o gamă largă de subiecte, potrivit The New York Times.

 

Modelele puternice ale DeepSeek

 

DeepSeek a dezvăluit primul său set de modele — DeepSeek Coder, DeepSeek LLM și DeepSeek Chat — în noiembrie 2023. Dar abia în primăvara trecută, când startup-ul a lansat familia de modele DeepSeek-V2 de generație următoare, industria inteligenței artificiale a început să ia în considerare acest lucru.

 

DeepSeek-V2, un sistem de analiză a textului și imaginilor de uz general, a avut performanțe bune în diverse teste de inteligență artificială – și a fost mult mai ieftin de utilizat decât modelele comparabile de la acea vreme. Acesta a obligat concurența internă a DeepSeek, inclusiv ByteDance și Alibaba, să reducă prețurile de utilizare pentru unele dintre modelele lor și să le facă complet gratuite pe altele.

 

DeepSeek-V3, lansat în decembrie 2024, nu a făcut decât să sporească notorietatea DeepSeek.

 

Conform testelor interne de referință ale DeepSeek, DeepSeek V3 depășește atât modelele descărcabile, disponibile public, precum  Llama de la Meta, cât și modelele „închise” care pot fi accesate doar printr-o API, cum ar fi GPT-4o de la OpenAI.

 

La fel de impresionant este modelul de „raționament” R1 al DeepSeek. Lansat în ianuarie, DeepSeek susține că R1 are performanțe la fel de bune ca modelul o1 al OpenAI în ceea ce privește testele cheie.

 

Fiind un model de raționament, R1 se verifică singur, ceea ce îl ajută să evite unele dintre capcanele care în mod normal împiedică modelele. Modelele de raționament au nevoie de puțin mai mult timp – de obicei de la secunde la minute mai mult – pentru a ajunge la soluții în comparație cu un model tipic fără raționament. Avantajul este că acestea tind să fie mai fiabile în domenii precum fizica, știința și matematica.

 

Există însă un dezavantaj al modelelor R1, DeepSeek V3 și ale celorlalte modele ale DeepSeek. Fiind IA dezvoltată în China, acestea sunt supuse unor  teste comparative efectuate  de autoritatea de reglementare a internetului din China pentru a se asigura că răspunsurile lor „încorporează valorile socialiste fundamentale”. În aplicația chatbot a DeepSeek, de exemplu, R1 nu răspunde la întrebări despre Piața Tiananmen sau autonomia Taiwanului.

 

În martie, DeepSeek a depășit 16,5 milioane de vizite. „[P]entru luna martie, DeepSeek se află pe locul al doilea, în ciuda unei scăderi a traficului cu 25% față de nivelul din februarie, pe baza vizitelor zilnice”, a declarat David Carr, redactor la Similarweb, pentru TechCrunch. Încă pălește în comparație cu ChatGPT, care a depășit 500 de milioane de utilizatori activi săptămânali în martie.

 

O abordare disruptivă

 

Dacă DeepSeek are un model de afaceri, nu este clar care este exact. Compania își stabilește prețurile produselor și serviciilor mult sub valoarea de piață – și oferă altele gratuit. De asemenea, nu acceptă bani de la investitori, în ciuda interesului mare al investitorilor de capital de risc.

 

Conform DeepSeek, progresele înregistrate în materie de eficiență i-au permis să mențină o competitivitate extremă în materie de costuri. Cu toate acestea, unii experți contestă cifrele furnizate de companie.

 

Indiferent de situație, dezvoltatorii au adoptat modelele DeepSeek, care nu sunt open source așa cum este înțeleasă în mod obișnuit sintagma, dar sunt disponibile sub licențe permisive care permit utilizarea comercială. Potrivit lui Clem Delangue, CEO-ul Hugging Face, una dintre platformele care găzduiește modelele DeepSeek, dezvoltatorii de pe Hugging Face au creat peste 500 de modele „derivate” ale R1, care au acumulat 2,5 milioane de descărcări în total.

 

Succesul DeepSeek împotriva rivalilor mai mari și mai consacrați a fost descris ca „o IA de răsturnare” și „supraevaluat”. Succesul companiei a fost cel puțin parțial responsabil pentru scăderea prețului acțiunilor Nvidia cu 18% în ianuarie și pentru provocarea unui răspuns public din partea CEO-ului OpenAI, Sam Altman. În martie, birourile Departamentului Comerțului din SUA le-au spus angajaților că DeepSeek va fi interzis pe dispozitivele lor guvernamentale, potrivit Reuters.

 

Microsoft a anunțat că DeepSeek este disponibil pe serviciul său Azure AI Foundry, platforma Microsoft care reunește servicii de inteligență artificială pentru companii sub un singur brand. Întrebat despre impactul DeepSeek asupra cheltuielilor cu inteligență artificială ale Meta în timpul conferinței sale privind rezultatele financiare din primul trimestru, CEO-ul Mark Zuckerberg a declarat că cheltuielile pentru infrastructura de inteligență artificială vor continua să fie un „avantaj strategic” pentru Meta. În martie, OpenAI a numit DeepSeek „subvenționat de stat” și „controlat de stat” și recomandă guvernului SUA să ia în considerare interzicerea modelelor din DeepSeek.

 

În timpul conferinței telefonice privind rezultatele financiare din trimestrul al patrulea al Nvidia, CEO-ul Jensen Huang a subliniat „inovația excelentă” a DeepSeek, spunând că aceasta și alte modele „de raționament” sunt excelente pentru Nvidia, deoarece au nevoie de mult mai multă putere de calcul.

 

În același timp, unele companii interzic DeepSeek, la fel și țări și guverne întregi, inclusiv Coreea de Sud. Statul New York a interzis, de asemenea, utilizarea DeepSeek pe dispozitivele guvernamentale.

 

În luna mai, vicepreședintele și președintele Microsoft, Brad Smith, a declarat într-o audiere în Senat că angajații Microsoft nu au voie să utilizeze DeepSeek din cauza preocupărilor legate de securitatea datelor și propagandă.

 

Cât despre ce ar putea rezerva viitorul DeepSeek, nu este clar. Modelele îmbunătățite sunt o certitudine. Însă guvernul SUA pare să fie din ce în ce mai precaut față de ceea ce percepe ca fiind o influență străină dăunătoare. În martie, The Wall Street Journal a relatat că SUA va interzice probabil DeepSeek pe dispozitivele guvernamentale.

 

*sursa foto techcrunch