OpenAI lancerer Sora 2: Video- og lydgenerering tager et kvantespring

OpenAI lancerer i dag Sora 2 – en markant opgradering af deres AI til videogenerering, der nu også skaber realistisk lyd og tale. Med forbedret fysik, finere kontrol og en ny iOS-app med social “cameo”-funktion bevæger Sora 2 sig fra proof-of-concept til praktisk anvendelighed. OpenAI lægger samtidig vægt på sikkerhed og forældrekontrol, og tjenesten rulles ud gratis med mulighed for en Pro-version til ChatGPT Pro-brugere.

Agentic
Af Agentic
4 Min Read

OpenAI lancerer Sora 2: Ny AI-model kan generere videoer med lyd og tale

OpenAI har i dag frigivet Sora 2, deres nyeste og mest avancerede model til generering af video og lyd. Den nye model markerer et betydeligt spring fremad i AI-drevet videokreation og er nu tilgængelig gennem en ny iOS-app.

Sora 2 repræsenterer en markant forbedring i forhold til den originale Sora-model, der blev lanceret i februar 2024. Hvor den første version var et proof-of-concept, beskriver OpenAI den nye model som et “GPT-3.5-øjeblik” for video – et gennembrud, der bringer teknologien væsentligt tættere på praktisk anvendelighed.

Mere realistisk fysik og kontrol

Den nye model udmærker sig særligt ved sin evne til at simulere komplekse fysiske bevægelser og dynamikker. Sora 2 kan generere videoer af olympiske gymnastikøvelser, baglæns saltomortaler på paddleboards med korrekt modellering af opdrift, og endda triple axels i kunstskøjteløb.

I modsætning til tidligere videogenereringsmodeller, der har tendens til at “snyde” ved at morphe objekter for at opfylde tekstbeskrivelser, respekterer Sora 2 fysikkens love. Hvis en basketballspiller misser et skud i en Sora 2-genereret video, vil bolden realistisk springe tilbage fra brættet – den teleporterer ikke magisk ind i kurven.

Modellen kan også generere sofistikerede lydbaggrunde, tale og lydeffekter med høj grad af realisme, hvilket gør den til et komplet video-audio-genereringssystem.

Ny social app med “cameo”-funktion

OpenAI lancerer samtidig en ny iOS-app kaldet simpelthen “Sora”, der er designet som en social platform. Appens mest bemærkelsesværdige funktion er “cameos”, som gør det muligt for brugere at indsætte sig selv i AI-genererede scener efter en kort engangsoptagelse til identitetsverifikation.

“Det føles som en naturlig evolution af kommunikation – fra tekstbeskeder til emojis til talebeskeder til dette,” forklarer Sora-teamet.

Appen er bevidst designet til at prioritere kreation over forbrug. OpenAI har udviklet nye typer anbefalingsalgoritmer, der kan instrueres gennem naturligt sprog, og som giver brugerne kontrol over deres feed. Virksomheden understreger, at de ikke optimerer for tid brugt i appen.

Sikkerhed og ansvar i fokus

OpenAI har implementeret flere sikkerhedsforanstaltninger. Brugere har fuld kontrol over deres digitale lighed og kan til enhver tid tilbagekalde adgang eller fjerne videoer, der indeholder deres cameo. For teenagere er der standardgrænser for, hvor mange genererede videoer de kan se dagligt, og der er strengere tilladelser for cameo-funktionen.

Appen lanceres med forældrekontrol via ChatGPT, så forældre kan administrere indstillinger for uendelig scrolling, algoritme-personalisering og direkte beskeder.

Tilgængelighed

Sora iOS-appen er tilgængelig til download nu, med initial udrulning i USA og Canada. OpenAI planlægger hurtigt at udvide til flere lande. Tjenesten vil indledningsvis være gratis med generøse begrænsninger, selvom disse er underlagt compute-kapacitet. ChatGPT Pro-brugere får også adgang til en eksperimentel Sora 2 Pro-model af højere kvalitet.

OpenAI beskriver Sora 2 som et vigtigt skridt mod generelle verdenssimulatorer og AI-systemer, der kan fungere i den fysiske verden – teknologi, som virksomheden mener vil “fundamentalt omforme samfundet og accelerere den menneskelige fremskridts bue.”

Share This Article
Ingen kommentarer

Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *