OpenAI lancerer Deep Research: Super-AI tager føringen i avanceret research

OpenAI lancerer Deep Research, en ny ChatGPT-funktion, der på få minutter kan gennemføre internetresearch, som normalt tager mennesker flere timer. Drevet af en o3-baseret model søger og analyserer systemet selvstændigt hundredvis af kilder og leverer detaljerede rapporter med kildehenvisninger – målrettet eksperter og krævende vidensarbejde, men også relevant for forbrugere ved større køb. De første tests viser markante fremskridt på krævende benchmarks, om end teknologien stadig kan fejle og kræver kildekritik. Funktionen er tilgængelig på web nu og rulles ud til mobil og desktop med begrænset månedlig adgang afhængigt af abonnement.

Agentic
Af Agentic
3 Min Read

OpenAI lancerer Deep Research: AI kan nu udføre timelangt researcharbejde på minutter

OpenAI har introduceret Deep Research, en ny avanceret funktion i ChatGPT, der kan udføre komplekst researcharbejde på internettet. Funktionen kan på få minutter gennemføre opgaver, der normalt ville tage mennesker flere timer.

Deep Research er drevet af en version af OpenAI’s kommende o3-model, der er optimeret til websøgning og dataanalyse. Systemet kan selvstændigt søge, fortolke og analysere hundredvis af online kilder for at skabe omfattende rapporter på niveau med professionelle researchanalytikere.

Sådan fungerer det

Brugere vælger ‘deep research’ i ChatGPT’s beskedkomponist og indtaster deres forespørgsel. Systemet bruger derefter mellem 5 og 30 minutter på at gennemføre research, mens brugeren kan arbejde videre med andre opgaver. Når arbejdet er færdigt, modtager brugeren en detaljeret rapport med klare kildehenvisninger.

Funktionen er særligt effektiv til at finde nicheinformation, der normalt ville kræve besøg på adskillige hjemmesider. Den kan også arbejde med uploadede filer og regneark for at tilføje kontekst til søgningen.

Målgruppen

Deep Research er udviklet til personer, der udfører intensivt videnarbejde inden for områder som finans, videnskab, politik og ingeniørarbejde. Men den kan også være nyttig for forbrugere, der ønsker grundige anbefalinger ved større indkøb som biler, husholdningsmaskiner eller møbler.

I modsætning til GPT-4o, der er ideel til realtidssamtaler, er Deep Research designet til dybdegående, domænespecifikke forespørgsler, hvor detaljer og verificerbare kilder er afgørende.

Imponerende testresultater

På Humanity’s Last Exam, en nyligt udgivet evaluering med over 3.000 ekspertspørgsmål på tværs af mere end 100 fagområder, opnåede modellen bag Deep Research 26,6% nøjagtighed – en ny rekord. Til sammenligning scorede OpenAI’s o1-model 9,1%.

På GAIA-benchmarket, der evaluerer AI på virkelige spørgsmål, nåede systemet også en ny førsteplads med 67,36% gennemsnitlig nøjagtighed.

I interne evalueringer af ekspertniveauopgaver vurderede fageksperter, at Deep Research havde automatiseret flere timers vanskelig, manuel research.

Begrænsninger

Selvom Deep Research åbner for betydelige nye muligheder, har systemet stadig begrænsninger. Det kan nogle gange hallucinere fakta eller drage forkerte konklusioner, dog i lavere grad end eksisterende ChatGPT-modeller. Det kan også have svært ved at skelne autoritativ information fra rygter og viser aktuelt svagheder i at formidle usikkerhed præcist.

Tilgængelighed

Deep Research er meget beregningsintensivt. Pro-brugere får adgang til op til 100 forespørgsler om måneden, Plus og Team-brugere får 25, mens gratis brugere får 5. Enterprise-kunder får også adgang.

OpenAI arbejder på at udvide adgangen og forventer at frigive en hurtigere, mere omkostningseffektiv version drevet af en mindre model, der stadig leverer høj kvalitet.

Funktionen er tilgængelig på ChatGPT web i dag og vil blive rullet ud til mobil- og desktop-apps inden for den næste måned.

Share This Article
Ingen kommentarer

Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *