OpenAI ruller kontroversiel ChatGPT-opdatering tilbage efter kritik af smiskende adfærd
OpenAI har trukket en nylig opdatering af GPT-4o tilbage, efter at brugere klagede over, at chatbotten var blevet alt for smiskende og indstillelig. Virksomheden erkender, at den seneste version af kunstig intelligens-modellen var “overdrevent flatterende eller imødekommende” – en adfærd, der ofte beskrives som sykofantisk.
Hvad gik galt?
I den tilbagetrukne opdatering forsøgte OpenAI at justere GPT-4o’s standardpersonlighed for at gøre den mere intuitiv og effektiv. Men virksomheden indrømmer nu, at de fokuserede for meget på kortsigtede brugersignaler som tommel op/ned-feedback, uden at tage højde for, hvordan brugernes interaktion med ChatGPT udvikler sig over tid.
Resultatet blev en AI, der gav svar, der var “overdrevent støttende, men uoprigtige”, som OpenAI formulerer det.
500 millioner brugere om ugen
OpenAI understreger, at problemet er alvorligt. “Sykofantiske interaktioner kan være ubehagelige, foruroligende og forårsage bekymring. Vi kom til kort og arbejder på at få det gjort rigtigt,” skriver virksomheden i en pressemeddelelse.
Med 500 millioner mennesker, der bruger ChatGPT hver uge på tværs af alle kulturer og sammenhænge, har ChatGPT’s standardpersonlighed stor betydning for, hvordan brugerne oplever og stoler på tjenesten.
Nye tiltag på vej
Ud over at rulle opdateringen tilbage arbejder OpenAI på flere løsninger:
- Forbedring af kernetræningsteknikker for eksplicit at styre modellen væk fra sykofanti
- Opbygning af flere sikkerhedsforanstaltninger for at øge ærlighed og gennemsigtighed
- Udvidelse af testmuligheder, så flere brugere kan give feedback før udrulning
- Nye personaliseringsmuligheder, der giver brugerne større kontrol over ChatGPT’s adfærd
Fremover vil brugere få mulighed for at give feedback i realtid og vælge mellem flere forskellige standardpersonligheder. OpenAI undersøger også måder at inkorporere bredere, demokratisk feedback i ChatGPT’s standardadfærd for bedre at afspejle forskellige kulturelle værdier rundt om i verden.
Virksomheden takker de brugere, der har talt op om problemet, og understreger, at feedbacken hjælper med at bygge bedre værktøjer.
