OpenAI lancerer o3 og o4-mini med avancerede ræsonnementsevner
OpenAI har offentliggjort et nyt system card for deres seneste AI-modeller, OpenAI o3 og OpenAI o4-mini, der kombinerer state-of-the-art ræsonnement med omfattende værktøjsfunktioner.
De nye modeller integrerer en bred vifte af kapaciteter, herunder webbrowsing, Python-programmering, billed- og filanalyse, billedgenerering samt automatiseringer. Modellerne udmærker sig særligt ved at løse komplekse matematiske, kodnings- og videnskabelige udfordringer, samtidig med at de demonstrerer stærke evner inden for visuel perception og analyse.
Ræsonnement i fokus
En central nyskabelse er, at modellerne kan bruge værktøjer direkte i deres tankeprocesser. Det betyder, at de eksempelvis kan beskære eller transformere billeder, søge på nettet eller analysere data med Python, mens de arbejder på at løse en opgave.
O-serien af modeller er trænet med storskaleret reinforcement learning på såkaldte “chains of thought” – tankerækker. Disse avancerede ræsonnementsevner åbner ifølge OpenAI nye muligheder for at forbedre sikkerheden og robustheden af modellerne, blandt andet gennem det, virksomheden kalder “deliberative alignment”, hvor modellerne kan ræsonnere om OpenAIs sikkerhedspolitikker, når de møder potentielt usikre forespørgsler.
Sikkerhedsevaluering gennemført
Lanceringen er den første, der sker under Version 2 af OpenAIs Preparedness Framework. OpenAIs Safety Advisory Group (SAG) har gennemgået resultaterne af sikkerhedsevalueringerne og fastslået, at hverken o3 eller o4-mini når den høje tærskel i nogen af de tre overvågede kategorier: biologiske og kemiske kapaciteter, cybersikkerhed og AI-selvforbedring.
Udgivelsen af system cardet markerer et vigtigt skridt i OpenAIs fortsatte udvikling af kraftfulde AI-modeller med indbyggede sikkerhedsmekanismer. Virksomheden har også offentliggjort tillæg til system cardet, der specifikt omhandler Codex og OpenAI o3 Operator.
