Sora 2: OpenAIs nye video-AI skaber realisme med lyd og tale

OpenAI lancerer Sora 2, en ny video- og lyd-AI, der sætter en ny standard for fysisk realisme og synkroniseret lyd og tale. Samtidig introduceres iOS-appen Sora med socialt fokus, “characters” og stærke velvære- og kontrolfunktioner, så brugere kan skabe, remixe og dele indhold på egne præmisser. Tjenesten starter i USA og Canada med en gratis plan, Pro-adgang til Sora 2 Pro samt planlagt API-udrulning.

Agentic
Af Agentic
4 Min Read

OpenAI lancerer Sora 2: Ny video-AI kan skabe realistiske videoer med lyd og tale

OpenAI har i dag offentliggjort Sora 2, deres seneste og mest avancerede model til generering af video og lyd. Den nye model markerer et betydeligt spring fremad inden for AI-genereret videoteknologi og er nu tilgængelig gennem en ny social iOS-app.

Markant forbedring af fysisk realisme

Sora 2 repræsenterer ifølge OpenAI “GPT-3.5-øjeblikket” for videogenerering. Modellen kan håndtere ekstremt komplekse opgaver som olympiske gymnastikrutiner, backflips på paddleboards og triple axels – alt sammen med præcis modellering af fysiske dynamikker som opdrift og stivhed.

En afgørende forskel fra tidligere videomodeller er, at Sora 2 respekterer fysikkens love. Hvor ældre modeller ville “snyde” for at opfylde en tekstprompt – eksempelvis teleportere en basketball til kurven – vil Sora 2 vise bolden prelle af brættet, hvis spilleren brænder skuddet.

“Modellen er overoptimistisk ikke længere,” forklarer OpenAI-teamet. “Den kan modellere fejl, ikke kun succes – en kritisk egenskab for enhver brugbar verdenssimulator.”

Synkroniseret lyd og tale

Ud over forbedret videokvalitet kan Sora 2 generere sofistikerede lydlandskaber, tale og lydeffekter med høj grad af realisme. Modellen kan skabe alt fra baggrundslyde til synkroniseret dialog.

En særlig funktion giver brugere mulighed for at uploade sig selv til systemet. Efter en kort video- og lydoptagelse kan brugere indsætte sig selv i enhver Sora-genereret scene med nøjagtig gengivelse af både udseende og stemme.

Ny social app med fokus på velvære

OpenAI lancerer samtidig en ny iOS-app kaldet “Sora”, der er bygget op omkring et socialt koncept med funktionen “characters”. Appen giver brugere mulighed for at skabe, remixe hinandens generationer og dele indhold i et personligt feed.

I modsætning til traditionelle sociale medier har OpenAI implementeret flere funktioner med fokus på brugervelvære:

  • Algoritmen kan styres gennem naturligt sprog, så brugerne selv bestemmer, hvad de ser
  • Appen er designet til at maksimere kreativitet frem for forbrug
  • Der er ingen optimering for tid brugt i feedet
  • Teenagere får automatiske daglige grænser for, hvor meget indhold de kan se
  • Forældre kan styre indstillinger gennem ChatGPT

Kontrol over eget billede

Med “characters”-funktionen har brugerne fuld kontrol over deres digitale billede. Kun brugeren selv beslutter, hvem der må bruge deres karakter, og adgang kan til enhver tid trækkes tilbage. Alle videoer, der indeholder en brugers karakter – inklusive kladder skabt af andre – er synlige for brugeren.

Tilgængelighed og priser

Sora iOS-appen kan downloades nu og er i første omgang tilgængelig i USA og Canada, med planer om hurtig ekspansion til flere lande. Tjenesten vil være gratis at bruge med generøse begrænsninger, dog underlagt tilgængelig computerkraft.

ChatGPT Pro-brugere får adgang til den eksperimentelle “Sora 2 Pro”-model med højere kvalitet. OpenAI planlægger også at frigive Sora 2 gennem deres API.

Den oprindelige Sora 1 Turbo-model forbliver tilgængelig, og alt tidligere skabt indhold vil blive bevaret i brugernes biblioteker.

Share This Article
Ingen kommentarer

Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *