OpenAI åbner op om ChatGPT’s adfærd: Brugerne skal få mere indflydelse
OpenAI har offentliggjort en omfattende redegørelse for, hvordan ChatGPT’s adfærd formes, og hvordan virksomheden planlægger at give brugerne mere kontrol over AI-systemets værdier og svar.
I et blogindlæg adresserer OpenAI de bekymringer, som mange brugere har rejst om politisk bias, stødende indhold og andre problematiske outputs fra ChatGPT. Virksomheden erkender, at mange af kritikpunkterne er berettigede og afslører reelle begrænsninger i deres systemer.
Sådan trænes ChatGPT
OpenAI forklarer, at udviklingen af ChatGPT foregår i to hovedfaser:
Pre-training: Modellen lærer at forudsige det næste ord i en sætning ved at blive eksponeret for enorme mængder internettekst. I denne fase lærer systemet grammatik, fakta om verden og ræsonneringsevner – men også de fordomme, der findes i teksterne.
Fine-tuning: Herefter finjusteres modellen ved hjælp af menneskelige reviewere, der følger retningslinjer udarbejdet af OpenAI. Reviewerne vurderer og bedømmer mulige modeloutputs for en række eksempelinputs, hvorefter modellen generaliserer fra denne feedback.
Kampen mod bias
OpenAI understreger, at virksomheden arbejder målrettet med at reducere bias i systemet. Som et led i gennemsigtigheden har virksomheden offentliggjort en del af de retningslinjer, som reviewerne arbejder efter, særligt vedrørende politiske og kontroversielle emner.
Retningslinjerne er eksplicitte om, at reviewere ikke må favorisere nogen politisk gruppe. “Bias, der alligevel måtte opstå, er fejl – ikke features,” slår OpenAI fast.
Tre byggesten for fremtiden
OpenAI præsenterer tre centrale principper for fremtidens AI-systemer:
1. Forbedret standardadfærd: Virksomheden investerer i forskning for at reducere både åbenlyse og subtile bias i ChatGPT’s svar.
2. Brugertilpasning inden for grænser: OpenAI udvikler en opgradering, der vil give brugerne mulighed for at tilpasse ChatGPT’s adfærd efter deres egne værdier – dog inden for rammer defineret af samfundet.
3. Offentlig indflydelse: Virksomheden ønsker at inddrage så mange perspektiver som muligt i beslutninger om systemets standardindstillinger og grænser. Dette inkluderer eksterne audits og offentlige høringer.
Vejen frem
OpenAI erkender, at processen er ufuldkommen, og at virksomheden vil begå fejl undervejs. Men med øget gennemsigtighed og brugerinddragelse håber virksomheden at udvikle AI-systemer, der både er nyttige og respekterer forskellige værdisæt.
“Vi værdsætter ChatGPT-fællesskabets og offentlighedens årvågenhed i at holde os ansvarlige,” skriver OpenAI og lover at dele mere om arbejdet i de kommende måneder.
Initiativet kommer på et tidspunkt, hvor debatten om AI-systemers magt og indflydelse intensiveres globalt, og hvor kravet om gennemsigtighed og demokratisk kontrol med teknologien vokser.
