OpenAI’s AI-gennembrud: Hurtigere læring med POLO

OpenAI præsenterer ny metode til effektiv læring i kunstig intelligens

OpenAI har offentliggjort en ny forskningsmetode, der kan lære komplekse opgaver på rekordtid ved at kombinere planlægning og læring på en ny måde.

Contents

OpenAI præsenterer ny metode til effektiv læring i kunstig intelligens

Hurtigere læring gennem bedre planlægning
Tre centrale komponenter
Betydning for fremtidig AI-udvikling

Forskere fra OpenAI har udviklet en framework kaldet POLO (Plan Online, Learn Offline), som gør det muligt for AI-agenter at lære avancerede opgaver markant hurtigere end tidligere metoder. Den nye tilgang kombinerer tre centrale elementer: lokal modelbaseret kontrol, global værdibaseret læring og strategisk udforskning.

Hurtigere læring gennem bedre planlægning

POLO-metoden bygger på en synergistisk sammenhæng mellem, hvordan AI-systemer planlægger handlinger og lærer af deres erfaringer. I stedet for at skulle træne i timevis eller dagevis, kan systemet nu mestre komplekse opgaver på minutter.

Forskerne har demonstreret metodens effektivitet på særligt udfordrende simulerede opgaver, herunder humanoid bevægelse og fingerfærdig manipulation af objekter. I disse tests kunne AI-systemerne lære opgaverne på hvad der svarer til få minutters erfaring i den virkelige verden.

Tre centrale komponenter

Den nye metode består af tre sammenhængende dele:

Lokal trajektorieoptimering hjælper systemet med at håndtere unøjagtigheder i værdiestimeringer og kan stabilisere og accelerere læreprocessen.

Approksimative værdifunktioner gør det muligt at reducere planlægningshorisonten og finde bedre løsninger end blot lokale optimeringer.

Koordineret udforskning bruger trajektorieoptimering til at udforske miljøet på en tidsmæssigt koordineret måde, samtidig med at usikkerheden i værdiestimeringerne tages i betragtning.

Betydning for fremtidig AI-udvikling

Forskningen, som er udført af Kendall Lowrey, Aravind Rajeswaran, Sham Kakade, Emanuel Todorov og Igor Mordatch, repræsenterer et vigtigt skridt mod mere effektive læringsmetoder inden for kunstig intelligens.

Den hurtigere læringshastighed kan potentielt reducere de ressourcer, der kræves for at træne AI-systemer, og gøre det mere praktisk at anvende avanceret maskinlæring i virkelige scenarier, hvor træning direkte i miljøet er nødvendig.

Forskningsartiklen er tilgængelig på arXiv og blev offentliggjort den 5. november 2018.

SAP og OpenAI i partnerskab om tysk AI-suverænitet

Bag ChatGPT: En ingeniørs kamp med AI-supercomputere

DALL·E åbner for alle!

OpenAI’s første hackathon: En succesfuld AI-begivenhed med fokus på diversitet

AI-robusthed: Kompleksiteten i at modstå angreb

Minnesota bruger ChatGPT til sprogbro i offentlig service

OpenAI foreslår ramme for AI-regulering

Apple og OpenAI forener ChatGPT med iOS

OpenAI Fellows: Fra Ambition til Baneskabende AI-Gennembrud

AI redder liv: Healthify transformerer sundhed med OpenAI

OpenAI’s nye AI-sikkerhedsteknik til komplekse opgaver: “Iterativ forstærkning”

OpenAI intensiverer statssamarbejde, sikrer Pentagon-kontrakt

Introducing AI for customer service

Top Stories

ChatGPT: Nye AI-funktioner målrettet erhvervslivet

OpenAI løfter sløret for bedre AI-genererede billeder med ny CLIP-metode

AI forvandler kundefeedback til guld for virksomheder

OpenAI’s AI-gennembrud: Hurtigere læring med POLO

OpenAI præsenterer ny metode til effektiv læring i kunstig intelligens

Hurtigere læring gennem bedre planlægning

Tre centrale komponenter

Betydning for fremtidig AI-udvikling

Skriv et svar Annuller svar

Related Strories

Claude AI lander i Microsoft Foundry og Excel

Intuit og OpenAI: AI revolutionerer personlig økonomi

Anthropic donerer kerne-AI-protokol til ny Linux Foundation-fond

Bag ChatGPT: En ingeniørs kamp med AI-supercomputere

Quicklinks

Company

Follow Socials

Introducing AI for customer service

Top Stories

OpenAI’s AI-gennembrud: Hurtigere læring med POLO

OpenAI præsenterer ny metode til effektiv læring i kunstig intelligens

Hurtigere læring gennem bedre planlægning

Tre centrale komponenter

Betydning for fremtidig AI-udvikling

Sign Up For Daily Newsletter

Be keep up! Get the latest breaking news delivered straight to your inbox.

Skriv et svar Annuller svar

Related Strories

Get Insider Tips and Tricks in Our Newsletter!