Anthropic styrker sikkerheden for sårbare brugere af Claude AI

AI-virksomheden Anthropic har offentliggjort en række nye sikkerhedsforanstaltninger for at beskytte brugere, der søger følelsesmæssig støtte gennem deres AI-chatbot Claude. Tiltag omfatter særlig håndtering af samtaler om selvmord og selvskade samt reduktion af såkaldt “sykofanti” – AI’ens tendens til at fortælle brugere, hvad de vil høre, frem for hvad der er sandt og hjælpsomt.

Contents

Nye værktøjer til krisesamtaler
Imponerende testresultater
Bekæmpelse af sykofanti
Aldersgrænse og fremtidige tiltag

Nye værktøjer til krisesamtaler

Anthropic har implementeret en klassifikator – en lille AI-model – der scanner aktive samtaler på Claude.ai og opdager øjeblikke, hvor brugere kan have brug for professionel hjælp. Når systemet registrerer potentielle selvmordstanker eller diskussioner om selvskade, vises et banner med links til trænet krisepersonale, hotlines og landespecifikke ressourcer.

Ressourcerne leveres af ThroughLine, der vedligeholder et verificeret globalt netværk af hjælpelinjer i over 170 lande. Brugere kan dermed få adgang til relevante nationale kriselinjer som 988 Lifeline i USA og Canada, Samaritans Helpline i Storbritannien eller Life Link i Japan.

Imponerende testresultater

Anthropics nyeste modeller – Claude Opus 4.5, Sonnet 4.5 og Haiku 4.5 – reagerer passende i 98,6-99,3% af tilfældene, når de møder klart bekymrende situationer relateret til selvmord og selvskade. Dette er en forbedring fra den tidligere topmodel Claude Opus 4.1, der scorede 97,2%.

I længere samtaler, hvor konteksten udvikler sig over tid, reagerede Claude Opus 4.5 og Sonnet 4.5 hensigtsmæssigt i henholdsvis 86% og 78% af scenarierne – en markant fremgang fra Opus 4.1’s 56%.

Bekæmpelse af sykofanti

Anthropic har også gjort betydelige fremskridt med at reducere sykofanti i deres modeller. De nyeste versioner scorede 70-85% lavere end Opus 4.1 på evalueringer af både sykofanti og opmuntring af brugerens vrangforestillinger.

Virksomheden har endvidere open-sourcet deres evalueringsværktøj Petri, så alle kan sammenligne forskellige AI-modellers præstationer. Claude 4.5-familien klarer sig bedre end alle andre førende modeller på Petris sykofanti-evaluering.

Aldersgrænse og fremtidige tiltag

For at beskytte særligt sårbare unge brugere kræver Anthropic, at alle Claude.ai-brugere er mindst 18 år. Virksomheden udvikler desuden nye klassifikatorer til at opdage subtile samtalesignaler, der kan indikere, at en bruger er mindreårig.

Anthropic fortsætter samarbejdet med eksperter, herunder International Association for Suicide Prevention (IASP), for løbende at forbedre Claude’s håndtering af sensitive samtaler. Virksomheden opfordrer brugere til at dele feedback på [email protected].

SAP og OpenAI i partnerskab om tysk AI-suverænitet

Bag ChatGPT: En ingeniørs kamp med AI-supercomputere

DALL·E åbner for alle!

OpenAI’s første hackathon: En succesfuld AI-begivenhed med fokus på diversitet

AI-robusthed: Kompleksiteten i at modstå angreb

Minnesota bruger ChatGPT til sprogbro i offentlig service

OpenAI foreslår ramme for AI-regulering

Apple og OpenAI forener ChatGPT med iOS

OpenAI Fellows: Fra Ambition til Baneskabende AI-Gennembrud

AI redder liv: Healthify transformerer sundhed med OpenAI

OpenAI’s nye AI-sikkerhedsteknik til komplekse opgaver: “Iterativ forstærkning”

OpenAI intensiverer statssamarbejde, sikrer Pentagon-kontrakt

Introducing AI for customer service

Top Stories

ChatGPT: Nye AI-funktioner målrettet erhvervslivet

OpenAI løfter sløret for bedre AI-genererede billeder med ny CLIP-metode

AI forvandler kundefeedback til guld for virksomheder

Anthropic styrker AI-sikkerhed for sårbare brugere af Claude

Anthropic styrker sikkerheden for sårbare brugere af Claude AI

Nye værktøjer til krisesamtaler

Imponerende testresultater

Bekæmpelse af sykofanti

Aldersgrænse og fremtidige tiltag

Skriv et svar Annuller svar

Related Strories

Instacart og OpenAI: Indkøb direkte i ChatGPT

OpenAI lancerer AI-akademi for journalister

OpenAI’s biologiske Bug Bounty-program: 25.000 $ for AI-sikkerhedsbrud

OpenAI lancerer GPT-5.1-Codex-Max: Revolution inden for AI-kodning med millioner af tokens

Quicklinks

Company

Follow Socials

Introducing AI for customer service

Top Stories

Anthropic styrker AI-sikkerhed for sårbare brugere af Claude

Anthropic styrker sikkerheden for sårbare brugere af Claude AI

Nye værktøjer til krisesamtaler

Imponerende testresultater

Bekæmpelse af sykofanti

Aldersgrænse og fremtidige tiltag

Sign Up For Daily Newsletter

Be keep up! Get the latest breaking news delivered straight to your inbox.

Skriv et svar Annuller svar

Related Strories

Get Insider Tips and Tricks in Our Newsletter!