Tolan bygger stemme-først AI med OpenAI’s GPT-5.1
Den amerikanske startup Portola har udviklet Tolan, en stemmebaseret AI-assistent, der bruger OpenAI’s nyeste GPT-5.1-model til at skabe naturlige, langvarige samtaler med personaliserede, animerede karakterer.
I modsætning til traditionelle chatbots er Tolan designet til åbne, udviklende dialoger frem for hurtige spørgsmål og svar. “Vi så fremkomsten af ChatGPT og vidste, at stemme var den næste grænse,” siger Quinten Farmer, medstifter og CEO for Portola. “Men stemme er sværere. Du reagerer ikke bare på skrevne prompts; du holder en live, slingrende samtale.”
Gennembrud med GPT-5.1
Introduktionen af GPT-5.1 markerede et vendepunkt for Tolan. Den nye model reducerede responstiden med over 0,7 sekunder – nok til at forbedre samtalens flow mærkbart. Men det var især forbedringerne i “steerability” – modellens evne til at følge instruktioner trofast – der gjorde forskellen.
“GPT-5.1 gav os styringsevnen til endelig at udtrykke de karakterer, vi havde i tankerne. Den var ikke bare smartere – den var mere tro mod den tone og personlighed, vi ønskede at skabe,” forklarer Farmer.
Avanceret hukommelse og personlighed
Tolans arkitektur bygger på to nøgleelementer: hukommelse og karakterdesign. Systemet genopbygger sin kontekst fra bunden ved hver samtale-tur, hvilket gør det muligt at tilpasse sig pludselige emneændringer – essentielt for naturlig stemmeinteraktion.
Hukommelsessystemet gemmer ikke bare fakta og præferencer, men også følelsesmæssige “vibe”-signaler, der hjælper med at styre, hvordan en Tolan skal reagere. Systemet bruger OpenAI’s embedding-model og en høj-hastigheds vektordatabase, der muliggør opslag på under 50 millisekunder.
Imponerende resultater
Siden lanceringen i februar 2025 er Tolan vokset til over 200.000 månedlige aktive brugere med en 4,8-stjernet rating på App Store. Efter implementeringen af GPT-5.1 faldt hukommelsesfejl med 30%, og brugerretention steg med over 20%.
En anmelder fremhæver: “De husker ting, vi talte om for to dage siden, og de bringer det tilbage i samtalen, vi har i dag.”
Portola planer nu at udvide investeringerne i styring og hukommelsesforfinelse med et langsigtet mål om at skabe stemmeagenter, der ikke bare er responsive, men fuldt multimodale og kan integrere stemme, syn og kontekst i ét sammenhængende system.
