OpenAI opdaterer retningslinjer for AI-adfærd med fokus på intellektuel frihed
OpenAI har offentliggjort en større opdatering af deres Model Spec – et dokument, der definerer, hvordan virksomhedens AI-modeller skal opføre sig. Den nye version styrker fokus på brugertilpasning, gennemsigtighed og intellektuel frihed, samtidig med at sikkerhedsforanstaltninger opretholdes.
Opdateringen bygger videre på fundamentet fra maj 2024 og er baseret på erfaringer fra både alignment-forskning og praktisk anvendelse hos brugere verden over.
Kommandokæde og principper
Model Spec balancerer forskellige hensyn gennem en klar kommandokæde, der prioriterer instruktioner fra platformen (OpenAI), udvikleren og brugeren i nævnte rækkefølge. De fleste retningslinjer kan tilsidesættes af brugere og udviklere inden for klart definerede grænser.
De centrale principper omfatter:
- Søg sandheden sammen: Modellerne skal undgå at styre brugere med en dagsorden og være objektive, samtidig med at de hjælper med at afklare mål og give kritisk feedback
- Lav det bedste arbejde: Sætter standarder for kompetence, faktuel nøjagtighed og kreativitet
- Hold dig inden for grænserne: Forklarer, hvordan modellen balancerer brugerautonomi med forholdsregler mod skade
- Vær imødekommende: Beskriver en varm, empatisk og hjælpsom samtalestil
- Brug passende stil: Giver vejledning om formatering og levering
Intellektuel frihed i centrum
Den opdaterede Model Spec omfavner eksplicit intellektuel frihed – idéen om, at AI skal give mennesker mulighed for at udforske, debattere og skabe uden vilkårlige begrænsninger, uanset hvor udfordrende eller kontroversielt et emne måtte være.
Mens modellen aldrig må give detaljerede instruktioner til at bygge bomber eller krænke privatlivets fred, opfordres den til at give gennemtænkte svar på politisk eller kulturelt følsomme spørgsmål – uden at fremme nogen bestemt dagsorden.
Målbare fremskridt
OpenAI har udviklet et testsæt af udfordrende prompts for at måle, hvor godt modellerne følger Model Spec’s principper. Foreløbige resultater viser betydelige forbedringer i modellernes overholdelse sammenlignet med systemet fra maj 2024.
Virksomheden har også gennemført pilotstudier med omkring 1.000 personer, der har evalueret modeladfærd og foreslåede regler. Disse indsigter har direkte påvirket nogle af ændringerne.
Open source-tilgang
OpenAI frigiver denne version af Model Spec til offentligheden under en Creative Commons CC0-licens, hvilket betyder, at udviklere og forskere frit kan bruge, tilpasse eller bygge videre på dokumentet.
Evalueringsprompts og Model Spec-kilden er tilgængelige i et nyt GitHub-repository, hvor virksomheden planlægger at udgive nye versioner løbende. Fremtidige opdateringer vil ikke længere blive annonceret via blogindlæg, men kan følges på model-spec.openai.com.
OpenAI understreger, at tilpasning af AI er en løbende proces, og opfordrer til feedback fra offentligheden.
