Paskutinę „Openai“ 12 dienų „Shipmas“ dieną bendrovė atidengė savo naujausius modelius „O3“ ir „O3-Mini“, kurie tobulėja dėl samprotavimo ir netgi pralenkė O1 etalonuose, įskaitant matematiką ir mokslą. Paleidimo metu „Openai“ generalinis direktorius Samas Altmanas teigė, kad O3 buvo numatytas sausio pabaigoje, o šiandien įmonė padarė gerą pažadą.
O3-Mini
Penktadienį „Openai“ visuomenei išleido „O3-Mini“ modelį-ekonomiškiausią „Openai“ samprotavimų serijos modelį. Iki šiol tą seriją sudarė O1 ir O1-Mini. Kaip ir jo pirmtakas, modelis yra ypač stiprus mokslo, matematikos ir kodavimo srityse, teigia bendrovė.
„Openai O3-Mini“ dabar galima įsigyti „ChatGPT“ ir API.
„Pro“ vartotojai turės neribotą prieigą prie „O3-Mini“, o „Plus“ ir „Team“ vartotojai turės trigubai didesnes normos ribas (VS O1-Mini).
Nemokami vartotojai gali išbandyti „O3-Mini“ „ChatGpt“, pasirinkdami mygtuką „Priežastis“, esantį pranešimo kompozitoriuje.– Openai (@Openai) 2025 m. Sausio 31 d
Kai bus pasirinktas „O3-Mini“, jis panaudos vidutines samprotavimo pastangas, kurios subalansuos greitį ir tikslumą. Nors originalus O1 modelis vis dar turi platesnių bendrųjų žinių nei „O3-Mini“, pagrindinis naujojo modelio pranašumas yra greitesnis jo greitis ir didesnis našumas, palyginti su O1-Mini.
Etaloninis spektaklis
Palyginus O3-mini veikimą su O1-mini, ekspertų testuotojai nustatė, kad O3-mini buvo pateikiami tikslesni, pagrįsti ir aiškesni atsakymai nei O1-Mini. Remiantis įrašu, jie pirmenybę teikė O3-mini atsakymams 56% laiko ir pastebėjo 39% sumažėjusį pagrindinių klaidų.
Be žmogaus pirmenybės vertinimų, keliuose STEM etalonuose, įskaitant konkurencijos matematiką (AIME 2024), daktaro laipsnio mokslo klausimus (GPQA deimantą) ir konkurencijos kodeksą (Codeforces), O3-mini su vidutiniu samprotavimu-būtent tai ir bus „ChatGPT“ vartotojai Pagal numatytuosius nustatymus-pralenktas O1-Mini.
Taip pat pastebėtina, kad „O3-Mini“, su didelėmis samprotavimo pastangomis etalonuose, priartėjo prie O1 našumo, kartais net pranokdamas jį, kaip matyti aukščiau esančioje AIIME 2024 ir programinės įrangos inžinerijos (SWE-Bench patvirtintos) etalonuose. „O3-Mini“ modelis su vidutinių samprotavimų pastangomis atitiko O1 našumą „Codeforces“ etalone.
Saugumas
„Openai“ įvertino „O3-Mini“ saugumą viešai išleisdamas per „Jailbreak“ ir neleido įvertinti turinio. Bendrovė nustatė, kad šis modelis žymiai pranoksta GPT-4O vertinimus. „Openai“ paskelbė žemiau pateiktus vertinimo rezultatus ir taip pat paleido „O3-Mini“ sistemos kortelę-37 puslapių PDF, į kurį įeina išsamūs vertinimų rezultatai.
Kaip pasiekti
Visi „Openai“ mokamų pakopų abonentai, įskaitant „ChatGpt Plus“, „Team“ ir „Pro“, gali pasiekti „Openai O3-Mini“ nuo šiandien. „Plus“ ir komandos vartotojai dabar turi tris kartus didesnę normos limitą-nuo 50 pranešimų per dieną su O1-Mini iki 150 pranešimų per dieną. „ChatGpt“ įmonės prieiga ateina per savaitę.
Taip pat: Galinga nauja „Copilot“ funkcija „Think Deeper“ yra nemokama visiems vartotojams – kaip ji veikia
„O3-Mini“ modelis pakeis „O1-Mini“ modelio rinkiklyje, nes jis būtų naudingas toms pačioms užduotims, išskyrus tai, kad dabar patirtis bus pagerinta esant mažesniam vėlavimui ir didesnėms greičio riboms. Kaip mokamas vartotojas, rašymo metu, aš dar neturėjau prieigos prie O3-Mini ir vis dar matau O1-Mini parinktį.
Jei neturite prenumeratos, nesijaudinkite: galite pamatyti, ar „O3-Mini“ yra verta iš jūsų nemokamos paskyros. Visi nemokami „ChatGpt“ vartotojai turi spustelėti „Priežastis“ „Message TextBox“ arba regeneruoti atsakymą. „Openai“ generalinis direktorius Sam Altmanas patvirtino nemokamą prieigą prie X. „Openai“ nemokamiems vartotojams nenurodė jokių naujojo modelio apribojimų.