OpenAI lancerer open source AI-sikkerhedsmodeller med tilpassede regler

OpenAI lancerer open source-sikkerhedsmodeller med tilpassede politikker

OpenAI har frigivet en forskningsforhåndsvisning af gpt-oss-safeguard, en ny type open source AI-modeller designet specifikt til sikkerhedsklassificering. Modellerne, der kommer i to størrelser på 120 milliarder og 20 milliarder parametre, repræsenterer en ny tilgang til indholdssikkerhed på digitale platforme.

Fleksibel sikkerhed med egne politikker

Det revolutionerende ved gpt-oss-safeguard er, at udviklere kan definere deres egne sikkerhedspolitikker direkte under brug af modellen, i stedet for at skulle træne en helt ny klassifikator fra bunden. Modellen bruger en ræsonneringsbaseret tilgang, hvor den analyserer indhold ud fra den specifikke politik, udvikleren har defineret, og forklarer sin beslutningsproces trinvist.

Dette gør det muligt for eksempelvis en spilforum at screene for indhold om snyd i spillet, eller en produktanmeldelsesside at identificere falske anmeldelser – alt sammen uden at skulle investere måneder i at indsamle tusindvis af træningseksempler.

Frigivet under åben licens

Modellerne er tilgængelige under den permissive Apache 2.0-licens, hvilket betyder, at alle frit kan bruge, modificere og implementere dem. De kan downloades fra Hugging Face og er udviklet i samarbejde med sikkerhedsorganisationen ROOST.

Allerede i brug hos OpenAI

OpenAI har selv brugt denne tilgang internt i deres “Safety Reasoner”-værktøj, som er blevet en central del af deres sikkerhedsinfrastruktur. I nogle af deres seneste lanceringer har op til 16% af den samlede computerkraft været afsat til sikkerhedsræsonnering.

Modellerne anvendes blandt andet til at evaluere billedgenerering og Sora 2-videoer i realtid, samt til at klassificere output fra GPT-5 og ChatGPT Agent.

Stærk performance trods mindre størrelse

I test har gpt-oss-safeguard overraskende præsteret bedre end den meget større gpt-5-thinking-model på visse opgaver, hvilket OpenAI selv beskriver som bemærkelsesværdigt givet modellernes relativt lille størrelse.

Begrænsninger og fremtiden

OpenAI erkender dog, at traditionelle klassifikatorer trænet på titusindvis af eksempler stadig kan præstere bedre i visse situationer, og at modellen kan være beregningstung at køre på stor skala.

Som en del af lanceringen etablerer ROOST et nyt model-fællesskab, hvor sikkerhedspraktikere og forskere kan dele bedste praksis for implementering af open source AI-modeller i sikkerhedsarbejde.

SAP og OpenAI i partnerskab om tysk AI-suverænitet

Bag ChatGPT: En ingeniørs kamp med AI-supercomputere

DALL·E åbner for alle!

OpenAI’s første hackathon: En succesfuld AI-begivenhed med fokus på diversitet

AI-robusthed: Kompleksiteten i at modstå angreb

Minnesota bruger ChatGPT til sprogbro i offentlig service

OpenAI foreslår ramme for AI-regulering

Apple og OpenAI forener ChatGPT med iOS

OpenAI Fellows: Fra Ambition til Baneskabende AI-Gennembrud

AI redder liv: Healthify transformerer sundhed med OpenAI

OpenAI’s nye AI-sikkerhedsteknik til komplekse opgaver: “Iterativ forstærkning”

OpenAI intensiverer statssamarbejde, sikrer Pentagon-kontrakt

Introducing AI for customer service

Top Stories

ChatGPT: Nye AI-funktioner målrettet erhvervslivet

OpenAI løfter sløret for bedre AI-genererede billeder med ny CLIP-metode

AI forvandler kundefeedback til guld for virksomheder

OpenAI lancerer open source AI-sikkerhedsmodeller med tilpassede regler

OpenAI lancerer open source-sikkerhedsmodeller med tilpassede politikker

Skriv et svar Annuller svar

Related Strories

OpenAI ramt af databrud hos partner

OpenAI lancerer Structured Outputs: Pålidelige JSON-svar fra AI-modeller

Google lancerer kraftfuld Gemini 3 AI til udviklere

Google lancerer Gemini 3 Pro Image til udviklere

Quicklinks

Company

Follow Socials

Introducing AI for customer service

Top Stories

OpenAI lancerer open source AI-sikkerhedsmodeller med tilpassede regler

OpenAI lancerer open source-sikkerhedsmodeller med tilpassede politikker

Sign Up For Daily Newsletter

Be keep up! Get the latest breaking news delivered straight to your inbox.

Skriv et svar Annuller svar

Related Strories

Get Insider Tips and Tricks in Our Newsletter!