2025 metų sausį DeepSeek R1 tapo sensacija: kinų startuolio mąstymo modelis aplenkė OpenAI konkurentus matematikos ir logikos testuose, o jo treniravimo kaina buvo šimtus kartų mažesnė nei amerikiečių analogų. Dabar DeepSeek pateikia tęsinį — DeepSeek R2. Ir skirtumas yra esminis.
Kuo R2 skiriasi nuo R1?
DeepSeek R1 naudojo sustiprintą mokymąsi (reinforcement learning) taisyklingam mąstymui — modelis mokėsi spręsti matematikos ir logikos uždavinius žingsnis po žingsnio, aiškiai parodydamas savo samprotavimo eigą. R2 šią techniką išplečia: modelis sugeba planuoti ilgesnes strategijas, peržiūrėti savo sprendimus viduryje proceso ir koreguoti kursą.
Praktiškai tai reiškia, kad R2 geriau susidoroja su sudėtingomis daugiažingsnėmis užduotimis — tokiomis kaip mokslinis tyrimas, programavimas su klaidomis arba teisinių dokumentų analizė. Tai ne tik greitis, bet ir kokybė.
Konkurencija su OpenAI o3 ir Claude
Mąstymo modelių rinkoje šiuo metu dominuoja du žaidėjai: OpenAI su savo o3 serija ir Anthropic su Claude. DeepSeek R2 tiesiogiai taikosi į abi kompanijas — ypač matematikos, programavimo ir mokslinių uždavinių srityse, kur objektyvūs testai leidžia aiškiai palyginti rezultatus.
Pirminiai rezultatai rodo, kad R2 yra lygiavertis arba geresnis nei OpenAI o3 mini sudėtingų matematinių uždavinių sprendime. Tai jau nebe „beveik toks pat kaip Vakaruose" — tai lygiavaržis konkurentas.
Kodėl tai svarbu atvirojo kodo bendruomenei
Kaip ir R1, DeepSeek išleido R2 su atvirais svoriais — bent jau vienos iš modelio versijų. Tai reiškia, kad universitetas Kaunе, startuolis Taline ar atskiras kūrėjas Vilniuje gali atsisiųsti modelį ir naudoti jį savo serveryje be jokių API mokesčių.
OpenAI ir Anthropic šios galimybės nesuteikia — jų modeliai pasiekiami tik per mokamas API. DeepSeek politika keičia jėgų pusiausvyrą: galingiausi mąstymo modeliai nebėra tik didžiųjų korporacijų privilegija.
Geopolitinis kontekstas
JAV jau apribojo Nvidijos H100 ir H800 GPU eksportą į Kiniją. Nepaisant to, DeepSeek kiekvieną kartą įrodo, kad apribojimai neveikia taip, kaip tikėjosi Vašingtonas. R2 sukurtas naudojant optimizuotas architektūras, kurios išspaudžia maksimumą iš mažiau galingo aparatūros — tai yra ne silpnybė, o priverstiniu būdu išsiugdytas pranašumas.
Tai kelia rimtų klausimų: ar eksporto kontrolė iš tikrųjų sulėtina Kinijos AI pažangą? Ar ji tik verčia kinų inžinierius rasti efektyvesnius sprendimus?
Ką tai reiškia vartotojams
DeepSeek R2 jau pasiekiamas per oficialią svetainę ir API. Lietuvoje ir Europoje jį galima naudoti tiesiai — nereikia VPN ar specialių sutarčių. Jei jums reikia modelio, kuris rimtai sprendžia matematinius ar loginius uždavinius, R2 yra rimta alternatyva GPT-5 ir Claude.
AI lenktynės tęsiasi. Ir šį kartą Kinija nebelaiko savęs antroje vietoje.