OpenAI’s DALL-E 2: Sikkerhedsforanstaltninger skaber uventet bias

OpenAI fjernede voldelige og seksuelle billeder fra DALL-E 2’s træningsdata

OpenAI har offentliggjort detaljer om de omfattende sikkerhedsforanstaltninger, der blev implementeret for at reducere risici forbundet med AI-billedgeneratoren DALL-E 2, før systemet blev gjort tilgængeligt for offentligheden.

Contents

OpenAI fjernede voldelige og seksuelle billeder fra DALL-E 2’s træningsdata

Uventet bias-problem
Kopiering af træningsbilleder forhindret

Virksomheden fjernede voldelige og seksuelle billeder fra de hundredvis af millioner af billeder, som DALL-E 2 blev trænet på. Uden denne filtrering ville modellen have lært at producere grafiske eller eksplicitte billeder, når brugere anmodede om dem, og kunne potentielt have returneret sådanne billeder utilsigtet som svar på tilsyneladende uskyldige forespørgsler.

Uventet bias-problem

Datafiltrering skabte imidlertid et uventet problem: Det forstærkede modellens bias over for visse demografiske grupper. Da OpenAI trænede to versioner af deres GLIDE-model – én på filtrerede og én på ufiltrerede data – opdagede de, at den filtrerede model producerede næsten udelukkende billeder af mænd som svar på prompts som “en CEO”.

Problemet opstod, fordi datasættet var biased mod at præsentere kvinder i mere seksualiserede kontekster. Filteret fjernede derfor flere billeder af kvinder end mænd, hvilket ændrede kønsfordelingen i træningsdataene. Konkret reducerede filteret frekvensen af ordet “kvinde” med 14%, mens ordet “mand” kun blev reduceret med 6%.

For at løse dette implementerede OpenAI en revægtningsmetode, der sikrede, at den filtrerede models fordeling bedre matchede fordelingen i de ufiltrerede billeder. Efter justeringen blev de relative frekvensreduktioner for “mand” og “kvinde” ændret til henholdsvis 1% og -1%.

Kopiering af træningsbilleder forhindret

OpenAI observerede også, at tidlige versioner af DALL-E 2 nogle gange reproducerede træningsbilleder ordret. Dette var problematisk både kreativt og juridisk, da det kunne rejse spørgsmål om ophavsret og privatlivets fred.

Undersøgelser viste, at alle de kopierede billeder havde mange næsten identiske duplikater i træningsdatasættet. Ved at fjerne duplikater – næsten en fjerdedel af hele datasættet – løste OpenAI problemet fuldstændigt. Overraskende nok foretrak menneskelige evaluatorer faktisk den model, der var trænet på de deduplikerede data, hvilket tyder på, at de redundante billeder faktisk havde skadet modellens ydeevne.

OpenAI understreger, at selvom disse tiltag repræsenterer betydelige fremskridt, er der stadig rum for forbedringer på alle områder, herunder bedre datafiltre, mere omfattende bias-evaluering og dybere forståelse af, hvordan og hvorfor AI-modeller memorerer træningsdata.

SAP og OpenAI i partnerskab om tysk AI-suverænitet

Bag ChatGPT: En ingeniørs kamp med AI-supercomputere

DALL·E åbner for alle!

OpenAI’s første hackathon: En succesfuld AI-begivenhed med fokus på diversitet

AI-robusthed: Kompleksiteten i at modstå angreb

Minnesota bruger ChatGPT til sprogbro i offentlig service

OpenAI foreslår ramme for AI-regulering

Apple og OpenAI forener ChatGPT med iOS

OpenAI Fellows: Fra Ambition til Baneskabende AI-Gennembrud

AI redder liv: Healthify transformerer sundhed med OpenAI

OpenAI’s nye AI-sikkerhedsteknik til komplekse opgaver: “Iterativ forstærkning”

OpenAI intensiverer statssamarbejde, sikrer Pentagon-kontrakt

Introducing AI for customer service

Top Stories

ChatGPT: Nye AI-funktioner målrettet erhvervslivet

OpenAI løfter sløret for bedre AI-genererede billeder med ny CLIP-metode

AI forvandler kundefeedback til guld for virksomheder

OpenAI’s DALL-E 2: Sikkerhedsforanstaltninger skaber uventet bias

OpenAI fjernede voldelige og seksuelle billeder fra DALL-E 2’s træningsdata

Uventet bias-problem

Kopiering af træningsbilleder forhindret

Skriv et svar Annuller svar

Related Strories

CRED: AI Revolutionerer Premium Kundeoplevelser

ChatGPT åbner for app-indsendelser og lancerer app-mappe

ChatGPT bliver din personlige shopping-assistent

AI udfører første cyberspionage-kampagne autonomt

Quicklinks

Company

Follow Socials

Introducing AI for customer service

Top Stories

OpenAI’s DALL-E 2: Sikkerhedsforanstaltninger skaber uventet bias

OpenAI fjernede voldelige og seksuelle billeder fra DALL-E 2’s træningsdata

Uventet bias-problem

Kopiering af træningsbilleder forhindret

Sign Up For Daily Newsletter

Be keep up! Get the latest breaking news delivered straight to your inbox.

Skriv et svar Annuller svar

Related Strories

Get Insider Tips and Tricks in Our Newsletter!