NVIDIA birželio 1 d. Computex Taipėjuje pristatė Nemotron 3 Ultra. Didžiausias bendrovės atvirasis modelis.

550B
parametrų iš viso
(55B aktyvių vienu metu)
~$750
kaina SWE-bench
kodavimo užduotims
300+
žetonų per sekundę
greitis

Techninė dalis: 550 mlrd. parametrų, bet vienu metu aktyvuoja tik 55 mlrd. Tai Mixture of Experts (MoE) architektūra — skirtingi modelio blokai specializuojasi skirtingoms užduotims. Dėl to jis dirba greičiau ir pigiau nei panašaus dydžio įprastinis modelis. Konteksto langas: iki 1 mln. žetonų.

Kainos efektyvumo frontas

Svarbiausia: Nemotron 3 Ultra atsidūrė kainos efektyvumo fronte tarp atvirų modelių. SWE-bench kodavimo testuose pasiekia ~70% užbaigtumą maždaug $750 kainoje. Kinų modeliai (Kimi K2.6, GLM-5.1, Qwen3.5) pasiekia panašius ar aukštesnius rezultatus, bet kainuoja $1 250–$2 000 už tą patį darbą.

Nemotron 3 Ultra daro tą patį darbą dvigubai mažesnėmis išlaidomis nei kinų konkurentai.

Lyginant su kitais modeliais

Artificial Analysis intelekto indekse Nemotron 3 Ultra gavo 48 taškus — geriausias JAV atvirasis modelis. «Google Gemma 4 31B» — 39, «OpenAI gpt-oss-120b» — 33. Tarp visų atvirų modelių pirmauja Kinija: Kimi K2.6 surinko 54 taškus, tačiau tą kokybę pasiekia dvigubai didesne kaina.

Modelis prieinamas nuo birželio 4 d. «HuggingFace», «OpenRouter» ir «NVIDIA NIM» platformose.