OpenAI Lancerer Sikkerhedsbenchmark for AI-Læring

OpenAI lancerer benchmark for sikker udforskning i dyb forstærkningslæring

OpenAI har offentliggjort et nyt forskningsprojekt, der fokuserer på at gøre kunstig intelligens sikrere, når den lærer gennem trial-and-error. Projektet introducerer en standardiseret måde at måle, hvor godt AI-systemer kan udforske deres omgivelser uden at forårsage skade.

Sikkerhed som kritisk fokusområde

Forstærkningslæring (reinforcement learning) er en AI-teknik, hvor systemer lærer optimale strategier ved at eksperimentere i deres miljø. Men i mange situationer kan fejl have alvorlige konsekvenser. For eksempel må robotsystemer, der interagerer med mennesker, aldrig forårsage skader, mens de lærer.

Selvom AI-agenter i dag primært trænes i simulerede miljøer, hvor sikkerhedsbekymringer er minimale, forventer OpenAI et skift mod træning direkte i den virkelige verden. Dette skyldes udfordringer med at simulere komplekse aspekter af virkeligheden, såsom interaktioner mellem mennesker og AI.

Tre centrale bidrag

OpenAI præsenterer tre væsentlige fremskridt inden for sikker AI-udforskning:

For det første foreslår forskerne at standardisere “constrained RL” (begrænset forstærkningslæring) som hovedmetoden til sikker udforskning. Dette bygger videre på tidligere forskning inden for sikker forstærkningslæring.

For det andet introducerer de Safety Gym – en ny pakke af testmiljøer designet til at måle fremskridt inden for begrænset forstærkningslæring. Disse miljøer involverer høj-dimensionel kontinuerlig kontrol og giver forskere standardiserede værktøjer til at evaluere deres algoritmer.

Endelig har teamet benchmarket flere algoritmer til begrænset dyb forstærkningslæring i Safety Gym-miljøerne for at etablere baseline-resultater, som fremtidig forskning kan bygge videre på.

Fremtidsperspektiv

Med dette arbejde positionerer OpenAI sikker udforskning som et kritisk fokusområde for AI-forskning. Projektet sigter mod at sikre, at AI-systemer kan lære og forbedre sig uden at udgøre risici for mennesker eller deres omgivelser – en afgørende forudsætning for bredere anvendelse af AI i den virkelige verden.

Forskningsartiklen er udarbejdet af Alex Ray, Joshua Achiam og Dario Amodei fra OpenAI.

SAP og OpenAI i partnerskab om tysk AI-suverænitet

Bag ChatGPT: En ingeniørs kamp med AI-supercomputere

DALL·E åbner for alle!

OpenAI’s første hackathon: En succesfuld AI-begivenhed med fokus på diversitet

AI-robusthed: Kompleksiteten i at modstå angreb

Minnesota bruger ChatGPT til sprogbro i offentlig service

OpenAI foreslår ramme for AI-regulering

Apple og OpenAI forener ChatGPT med iOS

OpenAI Fellows: Fra Ambition til Baneskabende AI-Gennembrud

AI redder liv: Healthify transformerer sundhed med OpenAI

OpenAI’s nye AI-sikkerhedsteknik til komplekse opgaver: “Iterativ forstærkning”

OpenAI intensiverer statssamarbejde, sikrer Pentagon-kontrakt

Introducing AI for customer service

Top Stories

ChatGPT: Nye AI-funktioner målrettet erhvervslivet

OpenAI løfter sløret for bedre AI-genererede billeder med ny CLIP-metode

AI forvandler kundefeedback til guld for virksomheder

OpenAI Lancerer Sikkerhedsbenchmark for AI-Læring

OpenAI lancerer benchmark for sikker udforskning i dyb forstærkningslæring

Skriv et svar Annuller svar

Related Strories

OpenAI lancerer o3 og o4-mini: Nye super-intelligente AI-modeller revolutionerer ræsonnering og multimodal tænkning

DALL-E introducerer “Outpainting”

Promega revolutionerer biomedicin med udbredt ChatGPT-brug

GPT-5 accelererer videnskabelige gennembrud

Quicklinks

Company

Follow Socials

Introducing AI for customer service

Top Stories

OpenAI Lancerer Sikkerhedsbenchmark for AI-Læring

OpenAI lancerer benchmark for sikker udforskning i dyb forstærkningslæring

Sign Up For Daily Newsletter

Be keep up! Get the latest breaking news delivered straight to your inbox.

Skriv et svar Annuller svar

Related Strories

Get Insider Tips and Tricks in Our Newsletter!