OpenAI præsenterer ny metode til forbedring af kunstig billedgenerering
Forskere fra OpenAI har udviklet en ny variant af generative adversarial networks (GANs), der lover mere stabil træning og bedre resultater inden for AI-baseret billedgenerering.
OpenAI har offentliggjort et forskningspapir om Optimal Transport GAN (OT-GAN), en ny tilgang til at træne kunstige intelligenser i at generere realistiske billeder. Metoden kombinerer optimal transport-teori med en ny måde at måle afstanden mellem AI-genererede billeder og ægte billeder på.
Det centrale i den nye metode er det, forskerne kalder “mini-batch energy distance” – en matematisk måde at sammenligne store mængder af genererede og virkelige billeder på. Denne tilgang giver mere pålidelige resultater, når AI’en trænes med store datamængder ad gangen.
Mere stabil træning
Et af de største problemer med traditionelle GANs har været ustabilitet under træning. OT-GAN adresserer dette problem ved at kombinere optimal transport i sin grundform med en energiafstand, der defineres i et feature-rum, som AI’en selv lærer at skelne i.
Resultatet er en distance-funktion, der er meget bedre til at skelne mellem ægte og genererede billeder, samtidig med at den giver mere stabile gradienter under træning med store mini-batches.
State-of-the-art resultater
I deres eksperimenter demonstrerer forskerne bag OT-GAN høj stabilitet ved træning med store mini-batches. Metoden har opnået state-of-the-art resultater på flere populære benchmark-problemer inden for billedgenerering.
Forskningen er udført af Tim Salimans, Han Zhang, Alec Radford og Dimitris Metaxas og blev offentliggjort den 15. marts 2018. Det fulde forskningspapir er tilgængeligt på arXiv.
Udviklingen af OT-GAN er endnu et skridt i OpenAI’s fortsatte arbejde med generative modeller, et forskningsområde der siden har ført til teknologier som DALL-E og andre avancerede billedgenereringssystemer.
