OpenAI išleido naujausią generatyvinį modelį, pavadintą o1. Tai yra pirmasis numatytos „mąstančių“ neuroninių tinklų serijos atstovas, apmokytas atsakinėti į sudėtingus klausimus greičiau nei žmonės.
Kartu buvo pristatyta ir mažesnė bei pigesnė versija pavadinimu o1-mini. Atrodo, kad tai yra ilgai laukta ir reklamuota Strawberry projekto versija.
Tai dar vienas ChatGPT kūrėjų žingsnis link pagrindinio tikslo – sukurti dirbtinį intelektą, prilygstantį žmogaus protui.
Kalbant apie praktines naujoves, šis modelis geriau atlieka kodavimo užduotis ir sprendžia daugiažingsnes užduotis, palyginti su savo pirmtakais.
Tačiau jis taip pat yra brangesnis ir lėtesnis, todėl kasdieniams darbams geriau naudoti senesnius įrankius.
Modelis taip pat sugeba savarankiškai taisyti klaidas, naudodamas pastiprinimo mokymosi (Reinforcement Learning, RL) techniką – atlygiais ir bausmėmis pagrįstą sistemą.
Be to, jis geba pradėti „minčių grandinę“, apdorodamas užklausas taip, kaip žmonės sprendžia problemas – žingsnis po žingsnio.
Kitaip tariant, modelis gali pats save tikrinti ir daryti tam tikras išvadas ateičiai, išsaugodamas jas savo atmintyje.
Nepaisant viso to, kūrėjai pripažįsta, kad visiškai atsikratyti „klaidų“ dar nepavyko. Tačiau ši problema sumažėjo.
Tuo tarpu matematikos srityje modelis jau yra beveik nepriekaištingas. Pavyzdžiui, GPT-4o teisingai išsprendė tik 13% Tarptautinės matematikos olimpiados užduočių, o o1 gavo 83%.
OpenAI tyrimų vadovas Džeris Tvorekas paaiškino, kad mokymosi metodai, naudoti o1, iš esmės skiriasi nuo ankstesnių.
Buvo naudojami kiti algoritmai ir naujas duomenų rinkinys. Kompanija šio modelio išleidimą vadina „ankstyvuoju peržiūrėjimu“, siekdama pabrėžti, kad jis dar jaunas.
ChatGPT Plus ir Team vartotojai jau šiandien gali naudotis o1 ir o1-mini. Enterprise ir Edu klientai galės išbandyti juos kitą savaitę.
Vėliau OpenAI planuoja padaryti „mini“ versiją viešai prieinamą.