OpenAI advarer mod misbrug af syntetiske stemmer
OpenAI har offentliggjort detaljer om Voice Engine, en AI-model der kan skabe realistiske stemmer ud fra blot 15 sekunders lydoptagelse. Men virksomheden holder teknologien tilbage af frygt for misbrug, særligt i et valgår.
OpenAI har valgt en usædvanlig forsigtig tilgang med deres nyeste teknologi. Voice Engine, som blev udviklet i slutningen af 2022, kan generere naturligt klingende tale, der tæt ligner den originale taler – alt sammen baseret på en kort lydprøve på bare 15 sekunder.
Teknologien bruges allerede i begrænset omfang til at drive de forudindstillede stemmer i OpenAI’s text-to-speech API samt ChatGPT Voice-funktioner. Men virksomheden har indtil videre kun givet adgang til en lille gruppe udvalgte partnere.
Lovende anvendelser
De tidlige tests viser lovende resultater på flere områder:
Uddannelse: Virksomheden Age of Learning bruger teknologien til at skabe mere naturligt klingende indhold til børn med en bredere vifte af stemmer end tidligere muligt.
Oversættelse: HeyGen anvender Voice Engine til at oversætte videoer og podcasts, så skabere kan nå et globalt publikum på deres eget sprog – og med deres egen stemme. Teknologien bevarer endda den originale talers accent.
Sundhed: Det mest rørende eksempel kommer fra Norman Prince Neurosciences Institute, hvor læger har brugt teknologien til at genskabe stemmen hos en ung patient, der mistede sin talefunktion på grund af en hjernetumor. Ved hjælp af blot 15 sekunders lyd fra en gammel skolevideo kunne de genskabe hendes stemme.
Sikkerhedsbekymringer
Men OpenAI er dybt bekymret over risikoen for misbrug. Virksomheden fremhæver særligt faren for stemmespoofing og deepfakes i et valgår.
Alle partnere skal følge strenge retningslinjer:
- Eksplicit samtykke fra den originale taler er påkrævet
- Klare oplysninger til publikum om, at stemmer er AI-genererede
- Forbud mod at efterligne andre personer uden samtykke
- Vandmærkning af alt genereret audio for at spore oprindelsen
Opfordring til handling
OpenAI opfordrer til samfundsmæssige ændringer for at håndtere den nye teknologi:
- Udfasning af stemmebaseret autentificering til bankkonti og følsomme data
- Udvikling af politikker til beskyttelse af individers stemmer
- Øget offentlig uddannelse om AI’s muligheder og begrænsninger
- Hurtigere udvikling af teknologi til at spore oprindelsen af audiovisuelt indhold
“Vi mener, at enhver bred udrulning af syntetisk stemmeteknologi bør ledsages af stemmeverifikation og systemer, der forhindrer skabelse af stemmer, der ligner fremtrædende personer,” udtaler OpenAI.
Virksomheden har endnu ikke besluttet, om og hvordan Voice Engine skal frigives til offentligheden i større skala.
