OpenAI en Microsoft pakken uit met nieuwe spraakmodellen

OpenAI en Microsoft pakken uit met nieuwe spraakmodellen
AI-gegeneerde afbeelding

OpenAI en Microsoft hebben tegelijk twee nieuwe AI-spraakmodellen aangekondigd

Zowel OpenAI als Microsoft hebben vandaag nieuwe AI-modellen voorgesteld die geoptimaliseerd zijn voor spraakgeneratie. De modellen zetten in op snelheid, natuurlijkheid en efficiëntie en kunnen breed ingezet worden, van klantenondersteuning tot het genereren van podcasts op basis van tekst.

OpenAI introduceert gpt-realtime

“Gpt-realtime is ons krachtigste stemmodel tot nu toe,” staat te lezen in een blogpost. Het genereert realistische en vloeiende spraak, en kan zelfs midden in een zin van toon of taal veranderen. Ontwikkelaars kunnen het model bovendien eenvoudig instructies meegeven om specifieke taken uit te voeren, zoals het citeren van helpdeskartikels in een chatbot.

Een nieuwe functie laat gebruikers ook toe om afbeeldingen te uploaden, bijvoorbeeld een screenshot van een softwareprobleem. Dat maakt gpt-realtime geschikt voor geavanceerde toepassingen in technische ondersteuning. Ontwikkelaars kunnen het model aanspreken via de nu algemeen beschikbare Realtime API.

Microsoft lanceert MAI-Voice-1 en MAI-1-preview

Microsoft stelt op zijn beurt MAI-Voice-1 voor, dat deel uitmaakt van de Microsoft Copilot-assistent. Het model is ontworpen met energie-efficiëntie als prioriteit: één minuut spraak wordt in minder dan een seconde gegenereerd, met slechts één GPU. MAI-Voice-1 krijgt in de toekomst gespecialiseerde modellen voor verschillende gebruiksdoelen.

Daarnaast onthult Microsoft MAI-1-preview, een krachtig multimodaal AI-model getraind op 15.000 Nvidia H100-chips. Door een mixture-of-experts-architectuur te gebruiken, worden slechts delen van het model gebruikt per prompt. MAI-1-preview is voorlopig enkel toegankelijk voor testgebruikers, maar komt binnenkort naar Copilot.

Microsoft is nu al bezig aan een opvolger, getraind op een supercluster met Nvidia’s nieuwste GB200-chips. Meer info daarover volgt later, schrijft de techgigant in de aankondiging.