AI modelių varžybose buvo taisyklė: kiekvienas modelis išsiskiria viena sritimi. Vienas stiprus kode, kitas — ilguose tekstuose, trečias — samprotavime. OpenAI naujasis GPT-5.4 laužo šią taisyklę. Pirmą kartą istorijoje vienas modelis pirmauja visose keturiose pagrindinėse kategorijose vienu metu.

„GPT-5.4 yra pirmas modelis, kuris nustato naują etaloną kode, samprotavime, ilgų kontekstų analizėje ir kompiuterio valdyme vienu metu." — OpenAI pranešimas
#1
Kodo rašymo testavimo rezultatai
#1
Samprotavimo ir logikos testai
44
Profesijos, kuriose AI veikia ekspertų lygiu

Kas pasikeitė

Ankstesni GPT modeliai dažnai reikalaudavo kompromisų: norėdamas geriausio kodo, rinkaisi specialų modelį; norėdamas geriausios analitikos — kitą. GPT-5.4 architektūra buvo pertvarkyta taip, kad skirtingos užduotys aktyvuoja skirtingus modelio komponentus — tai vadinama „mixture of experts" (ekspertų mišinio) principu, bet daug labiau integruotu nei anksčiau.

Praktinis rezultatas: nereikia rinktis. Tas pats modelis, kuriam paprašysite parašyti Python kodą, taip pat padės išanalizuoti 200 puslapių sutartį ir sugeneruos strateginę ataskaitą — ir kiekvienas iš šių rezultatų bus etaloniniu lygiu.

44 profesijos — ekspertų lygyje

Stanford HAI 2026 ataskaitoje cituojami duomenys rodo: GPT-5.4 ir panašūs modeliai šiandien veikia ekspertų lygyje 44 profesijose — nuo radiologijos iki finansų analizės. Tai nereiškia, kad specialistai nebereikalingi. Tai reiškia, kad modelis gali atlikti jų darbo dalį — ir kartais geriau.

Medicinos srityje modeliai diagnozuoja retas ligas tiksliau nei vidutinis gydytojas; teisės srityje analizuoja sutartis greičiau nei asocijuotasis partneris; finansuose — identifikuoja rizikas, kurias praleido analitikas. Ne visose situacijose, ne visada — bet pakankamai dažnai, kad tai keistų darbo procesus.

Ar tai reiškia, kad ChatGPT Plus verta mokėti?

GPT-5.4 pasiekiamas per ChatGPT Plus prenumeratą ($20/mėn.) ir API. Nemokamas planas naudoja senesnį modelį. Jei jūsų darbas susijęs su kodo rašymu, ilgų dokumentų analize ar sudėtingesniu planavimu — $20 per mėnesį greičiausiai atsipirks per pirmą savaitę.

Jei naudojate AI retai ar tik paprastiems klausimams — nemokamo plano pakanka. Bet verta bent kartą išbandyti pilną versiją, kad suprastumėte skirtumą.