GPT-5.2 sætter ny standard inden for videnskabelig forskning
OpenAI har netop præsenteret deres nyeste AI-model, GPT-5.2, som viser bemærkelsesværdige fremskridt inden for matematik og videnskabelig forskning. Modellen har ikke blot forbedret ydeevnen på akademiske tests – den har faktisk hjulpet med at løse et åbent forskningsproblem inden for statistisk læringsteori.
Gennembrud på ekspertniveau
GPT-5.2 Pro og GPT-5.2 Thinking udgør ifølge OpenAI verdens bedste modeller til at assistere og accelerere videnskabeligt arbejde. På GPQA Diamond, en benchmark-test på kandidatniveau, opnår GPT-5.2 Pro en score på 93,2 procent. På FrontierMath, der tester ekspertviden i matematik, løste GPT-5.2 Thinking 40,3 procent af problemerne – en ny rekord.
Det er især modelens evne til matematisk ræsonnement, der skiller sig ud. Denne kapacitet er fundamental for pålidelig videnskabelig analyse, hvor selv små fejl kan få store konsekvenser i simuleringer, statistik og modellering.
Løste uløst matematisk problem
I et konkret eksempel bidrog GPT-5.2 Pro til at løse et åbent forskningsspørgsmål, der har optaget forskere siden 2019: Bliver resultater konsekvent bedre, når man indsamler mere data?
Spørgsmålet lyder simpelt, men har vist sig overraskende komplekst. Tidligere forskning har afsløret, at selv enkle statistiske modeller kan udvise ikke-monoton adfærd, hvor mere data faktisk kan øge fejlraten. Det nye studie, dokumenteret i artiklen “On Learning-Curve Monotonicity for Maximum Likelihood Estimators”, viser at i de mest grundlæggende tilfælde fungerer intuition trods alt: Mere data giver bedre resultater.
Det usædvanlige ved studiet er, at forskerne ikke gav modellen en strategi eller mellemliggende argumenter. De stillede blot GPT-5.2 Pro det åbne problem direkte, hvorefter modellen producerede et bevis, som efterfølgende blev verificeret af eksterne eksperter.
Mennesket forbliver central
OpenAI understreger dog, at AI-systemerne ikke er uafhængige forskere. Ekspertvurdering, verifikation og domæneforståelse forbliver essentielle. Selv meget kapable modeller kan begå fejl eller bygge på ustatserede antagelser.
“Brugt omhyggeligt kan sådanne systemer hjælpe med at strømline væsentlige aspekter af teoretisk arbejde uden at fortrænge menneskets centrale rolle i videnskabelig forskning,” lyder det fra OpenAI.
Udviklingen peger på en ny arbejdsform, hvor AI-modeller som GPT-5.2 kan fungere som værktøjer til at understøtte matematisk ræsonnement og accelerere tidlig udforskning, mens ansvaret for korrekthed og fortolkning forbliver hos menneskelige forskere.
