OpenAI lancerer Deep Research: AI udfører timelang research på minutter

OpenAI lancerer Deep Research – en ny AI-agent i ChatGPT, der på 5–30 minutter kan udføre komplekst researcharbejde og levere detaljerede, kildebelagte rapporter. Drevet af en o3-baseret model optimeret til webbrowsing og dataanalyse sætter den nye standarder på flere benchmarks og retter sig mod vidensarbejdere såvel som forbrugere. Funktionen rulles ud med begrænsede forespørgselsgrænser og er på vej til mobil- og desktop-apps, selvom den stadig kan lave fejl og misvurdere kilder.

Agentic
Af Agentic
3 Min Read

OpenAI lancerer Deep Research: AI kan nu udføre timelangt researcharbejde på minutter

OpenAI har netop introduceret Deep Research i ChatGPT – en ny AI-agent, der kan udføre komplekst researcharbejde selvstændigt. Funktionen kan på få titusinder af minutter gennemføre research, der normalt ville tage mennesker flere timer.

Deep Research er designet til at fungere som en forskningsanalytiker, der kan finde, analysere og sammenfatte hundredvis af online kilder til omfattende rapporter. Systemet er drevet af en version af OpenAIs kommende o3-model, der er optimeret til webbrowsing og dataanalyse.

Sådan fungerer det

Brugere vælger ‘deep research’ i ChatGPT’s beskedkomponist og indtaster deres forespørgsel. AI’en arbejder derefter selvstændigt i 5-30 minutter, hvor den systematisk søger, analyserer og sammenstiller information fra internettet. Undervejs vises en oversigt over de trin, systemet tager, og hvilke kilder det bruger.

Det færdige resultat leveres som en detaljeret rapport med fuldstændige kildehenvisninger, hvilket gør det nemt at verificere informationen. I de kommende uger vil rapporterne også inkludere indlejrede billeder og datavisualiseringer.

Imponerende resultater på benchmarks

Deep Research har sat nye standarder på flere akademiske tests. På “Humanity’s Last Exam” – en evaluering med over 3.000 ekspertspørgsmål inden for alt fra lingvistik til raketvidenskab – opnåede systemet 26,6% nøjagtighed, hvilket er markant højere end tidligere modeller.

På GAIA-benchmarket, der tester AI på virkelige spørgsmål, nåede Deep Research en ny rekord med 67,36% gennemsnitlig nøjagtighed på tværs af tre sværhedsgrader.

Målgruppe og anvendelsesmuligheder

Funktionen er primært rettet mod folk, der udfører intensivt videnarbejde inden for områder som finans, videnskab, politik og ingeniørarbejde. Men den kan også være nyttig for forbrugere, der ønsker grundig research før større indkøb som biler eller møbler.

I interne tests med ekspertopgaver vurderede fagfolk, at Deep Research automatiserede flere timers manuelt undersøgelsesarbejde.

Begrænsninger og adgang

Selvom funktionen er imponerende, har den stadig begrænsninger. Den kan nogle gange hallucere fakta eller lave forkerte slutninger, dog i mindre grad end eksisterende ChatGPT-modeller. Systemet kan også have svært ved at skelne mellem autoritative kilder og rygter.

Deep Research er i øjeblikket meget beregningskrævende og derfor begrænset tilgængeligt. Pro-brugere får 250 forespørgsler om måneden, Plus- og Team-brugere får 25, mens gratis brugere får 5. Funktionen er tilgængelig på ChatGPT web og vil blive rullet ud til mobil- og desktop-apps inden for en måned.

OpenAI arbejder på en hurtigere og mere omkostningseffektiv version drevet af en mindre model, hvilket vil give alle betalende brugere betydeligt højere grænser.

Share This Article
Ingen kommentarer

Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *