OpenAI: Ny robotlæring med minimale fremskridt

OpenAI præsenterer ny læringsmetode til robotter med sparsomme belønninger

OpenAI har offentliggjort en ny teknik kaldet “Hindsight Experience Replay” (HER), der gør det muligt for robotter at lære komplekse opgaver, selv når de kun modtager minimale belønningssignaler under træningen.

Contents

OpenAI præsenterer ny læringsmetode til robotter med sparsomme belønninger

Testet på robotarme
Fra simulation til virkelighed

En af de største udfordringer inden for reinforcement learning – den maskinlæringsmetode, hvor systemer lærer gennem forsøg og fejl – har været at håndtere såkaldte “sparse rewards”. Det betyder situationer, hvor robotten kun sjældent får feedback om, hvorvidt den gør det rigte.

Den nye HER-teknik løser dette problem ved at lade robotter lære af deres fejl på en ny måde. Metoden kan kombineres med eksisterende reinforcement learning-algoritmer og fungerer som en form for implicit læseplan, der gradvist øger sværhedsgraden.

Testet på robotarme

Forskerne fra OpenAI har demonstreret tilgangen på opgaver, hvor en robotarm skal manipulere objekter. De har gennemført eksperimenter med tre forskellige opgaver: skubbe, skyde og samle-og-placere objekter.

I alle tilfælde brugte systemet kun binære belønninger – altså simple ja/nej-signaler om, hvorvidt opgaven var fuldført eller ej. Dette eliminerer behovet for kompliceret “reward engineering”, hvor forskere ellers skal designe sofistikerede belønningssystemer.

Fra simulation til virkelighed

Studierne viser, at Hindsight Experience Replay er en afgørende ingrediens, der gør træning mulig i disse udfordrende miljøer. Forskerne har desuden demonstreret, at politikker trænet i fysiske simuleringer succesfuldt kan implementeres på fysiske robotter og gennemføre opgaverne i den virkelige verden.

Artiklen er publiceret på arXiv og er forfattet af et team af forskere fra OpenAI, herunder Marcin Andrychowicz, Filip Wolski, Alex Ray, Jonas Schneider, Rachel Fong, Peter Welinder, Bob McGrew, Josh Tobin, Pieter Abbeel og Wojciech Zaremba.

SAP og OpenAI i partnerskab om tysk AI-suverænitet

Bag ChatGPT: En ingeniørs kamp med AI-supercomputere

DALL·E åbner for alle!

OpenAI’s første hackathon: En succesfuld AI-begivenhed med fokus på diversitet

AI-robusthed: Kompleksiteten i at modstå angreb

Minnesota bruger ChatGPT til sprogbro i offentlig service

OpenAI foreslår ramme for AI-regulering

Apple og OpenAI forener ChatGPT med iOS

OpenAI Fellows: Fra Ambition til Baneskabende AI-Gennembrud

AI redder liv: Healthify transformerer sundhed med OpenAI

OpenAI’s nye AI-sikkerhedsteknik til komplekse opgaver: “Iterativ forstærkning”

OpenAI intensiverer statssamarbejde, sikrer Pentagon-kontrakt

Introducing AI for customer service

Top Stories

ChatGPT: Nye AI-funktioner målrettet erhvervslivet

OpenAI løfter sløret for bedre AI-genererede billeder med ny CLIP-metode

AI forvandler kundefeedback til guld for virksomheder

OpenAI: Ny robotlæring med minimale fremskridt

OpenAI præsenterer ny læringsmetode til robotter med sparsomme belønninger

Testet på robotarme

Fra simulation til virkelighed

Skriv et svar Annuller svar

Related Strories

OpenAI lancerer open source-modeller til indholdsmoderatorer

Googles Gemini 3 Flash: Hurtig og Billig AI til Udviklere

OpenAI styrker AI-sikkerhed med nyt instruktionshierarki

OpenAI åbner første tyske kontor i München

Quicklinks

Company

Follow Socials

Introducing AI for customer service

Top Stories

OpenAI: Ny robotlæring med minimale fremskridt

OpenAI præsenterer ny læringsmetode til robotter med sparsomme belønninger

Testet på robotarme

Fra simulation til virkelighed

Sign Up For Daily Newsletter

Be keep up! Get the latest breaking news delivered straight to your inbox.

Skriv et svar Annuller svar

Related Strories

Get Insider Tips and Tricks in Our Newsletter!