
OpenAI heeft de alpha-release aangekondigd van de De geavanceerde stemmodus van ChatGPT, aangedreven doorinnovatief GPT-4o-model. Deze revolutionaire functie, die belooft te presteren hyperrealistische audioreacties, zal vanaf vandaag in eerste instantie toegankelijk zijn voor een kleine groep ChatGPT Plus-gebruikers, met als doel de beschikbaarheid uit te breiden naar alle Plus-abonnees tegen het najaar van 2024.
Spraakmodus: de stemmodus van ChatGPT is officieel
De presentatie van de spraakmodus met GPT-4o, die in mei plaatsvond, had grote belangstelling en bewondering gewekt bij het publiek, dankzij de buitengewone generatiesnelheid en de opvallende gelijkenis met een echte menselijke stem, die vergelijkingen heeft opgeroepen met die van de beroemde actrice Scarlett Johansson.
OpenAI ontkende de stem van de actrice te hebben gebruikt, verwijderde vervolgens de stem uit de demo en kondigde in juni een stel de release van de geavanceerde stemmodus uit om de veiligheidsmaatregelen te verbeteren.
In deze alfafase zullen sommige functies die tijdens de voorjaarsupdate worden getoond, zoals video en scherm delen, niet worden opgenomen en op een later tijdstip worden geïntroduceerd. Echter, een geselecteerde groep premium gebruikers heeft toegang tot de ChatGPT-stemfunctie die in de demo wordt gepresenteerd.
Zie ook: SearchGPT: wat de OpenAI-zoekmachine is en hoe deze werkt
De Advanced Voice-modus verschilt van de audio-oplossing die momenteel wordt aangeboden door ChatGPT, die is gebaseerd op drie verschillende modellen. GPT-4o, dankzij de zijne natura multimodaal, kan deze taken verwerken zonder toevlucht te nemen tot hulpmodellen, en daarmee vocale reacties genereren Aanzienlijk verminderde latentie. Bovendien benadrukt OpenAI het vermogen van GPT-4o om emotionele nuances in de stem waarnemen, zoals verdriet en opwinding, en het herkennen van zingen.
Om een zorgvuldige monitoring van het spraakgebruik van ChatGPT te garanderen, heeft OpenAI gekozen voor een geleidelijke afgifte. Leden van het Alpha-programma ontvangen een melding in de ChatGPT-app, gevolgd door een e-mail met instructies voor het gebruik van de functie.
De vocale mogelijkheden van GPT-4o ze zijn getest in 45 talen, wat de toewijding van OpenAI aantoont om deze technologie toegankelijk te maken voor een breed internationaal publiek. Daarnaast heeft het bedrijf nieuwe filters geïmplementeerd verzoeken om muziek te maken voorkomen of ander audiomateriaal dat auteursrechtelijk beschermd is en daarmee de intellectuele eigendom beschermt.
De verbeterde stemmodus van ChatGPT zal in eerste instantie beperkt zijn tot vier vooraf ingestelde stemmen door ChatGPT: Juniper, Breeze, Cove en Ember, gemaakt in samenwerking met professionele stemacteurs. ChatGPT zal niet de mogelijkheid hebben om de stemmen van andere mensen te imiteren en zal elke output blokkeren die afwijkt van deze standaardstemmen, waardoor ethisch en verantwoord gebruik van de technologie wordt gegarandeerd.