OpenAI lancerer Deep Research: AI kan nu udføre timelangt researcharbejde på minutter
OpenAI har netop introduceret Deep Research i ChatGPT – en ny AI-agent, der kan udføre komplekst researcharbejde selvstændigt. Funktionen kan på få titusinder af minutter gennemføre research, der normalt ville tage mennesker flere timer.
Deep Research er designet til at fungere som en forskningsanalytiker, der kan finde, analysere og sammenfatte hundredvis af online kilder til omfattende rapporter. Systemet er drevet af en version af OpenAIs kommende o3-model, der er optimeret til webbrowsing og dataanalyse.
Sådan fungerer det
Brugere vælger ‘deep research’ i ChatGPT’s beskedkomponist og indtaster deres forespørgsel. AI’en arbejder derefter selvstændigt i 5-30 minutter, hvor den systematisk søger, analyserer og sammenstiller information fra internettet. Undervejs vises en oversigt over de trin, systemet tager, og hvilke kilder det bruger.
Det færdige resultat leveres som en detaljeret rapport med fuldstændige kildehenvisninger, hvilket gør det nemt at verificere informationen. I de kommende uger vil rapporterne også inkludere indlejrede billeder og datavisualiseringer.
Imponerende resultater på benchmarks
Deep Research har sat nye standarder på flere akademiske tests. På “Humanity’s Last Exam” – en evaluering med over 3.000 ekspertspørgsmål inden for alt fra lingvistik til raketvidenskab – opnåede systemet 26,6% nøjagtighed, hvilket er markant højere end tidligere modeller.
På GAIA-benchmarket, der tester AI på virkelige spørgsmål, nåede Deep Research en ny rekord med 67,36% gennemsnitlig nøjagtighed på tværs af tre sværhedsgrader.
Målgruppe og anvendelsesmuligheder
Funktionen er primært rettet mod folk, der udfører intensivt videnarbejde inden for områder som finans, videnskab, politik og ingeniørarbejde. Men den kan også være nyttig for forbrugere, der ønsker grundig research før større indkøb som biler eller møbler.
I interne tests med ekspertopgaver vurderede fagfolk, at Deep Research automatiserede flere timers manuelt undersøgelsesarbejde.
Begrænsninger og adgang
Selvom funktionen er imponerende, har den stadig begrænsninger. Den kan nogle gange hallucere fakta eller lave forkerte slutninger, dog i mindre grad end eksisterende ChatGPT-modeller. Systemet kan også have svært ved at skelne mellem autoritative kilder og rygter.
Deep Research er i øjeblikket meget beregningskrævende og derfor begrænset tilgængeligt. Pro-brugere får 250 forespørgsler om måneden, Plus- og Team-brugere får 25, mens gratis brugere får 5. Funktionen er tilgængelig på ChatGPT web og vil blive rullet ud til mobil- og desktop-apps inden for en måned.
OpenAI arbejder på en hurtigere og mere omkostningseffektiv version drevet af en mindre model, hvilket vil give alle betalende brugere betydeligt højere grænser.
