NVIDIA birželio 1 d. Computex Taipėjuje pristatė Nemotron 3 Ultra. Didžiausias bendrovės atvirasis modelis.
(55B aktyvių vienu metu)
kodavimo užduotims
greitis
Techninė dalis: 550 mlrd. parametrų, bet vienu metu aktyvuoja tik 55 mlrd. Tai Mixture of Experts (MoE) architektūra — skirtingi modelio blokai specializuojasi skirtingoms užduotims. Dėl to jis dirba greičiau ir pigiau nei panašaus dydžio įprastinis modelis. Konteksto langas: iki 1 mln. žetonų.
Kainos efektyvumo frontas
Svarbiausia: Nemotron 3 Ultra atsidūrė kainos efektyvumo fronte tarp atvirų modelių. SWE-bench kodavimo testuose pasiekia ~70% užbaigtumą maždaug $750 kainoje. Kinų modeliai (Kimi K2.6, GLM-5.1, Qwen3.5) pasiekia panašius ar aukštesnius rezultatus, bet kainuoja $1 250–$2 000 už tą patį darbą.
Lyginant su kitais modeliais
Artificial Analysis intelekto indekse Nemotron 3 Ultra gavo 48 taškus — geriausias JAV atvirasis modelis. «Google Gemma 4 31B» — 39, «OpenAI gpt-oss-120b» — 33. Tarp visų atvirų modelių pirmauja Kinija: Kimi K2.6 surinko 54 taškus, tačiau tą kokybę pasiekia dvigubai didesne kaina.
Modelis prieinamas nuo birželio 4 d. «HuggingFace», «OpenRouter» ir «NVIDIA NIM» platformose.