In WinRT 8.1 sono state introdotte le Windows.Media.SpeechSynthesis API per permettere di trasformare un testo in uno stream audio, con caratteristiche di voce e pronuncia simile ad un essere umano, funzionalità nota genericamente come text-to-speech (TTS).
Per utilizzare le API è sufficiente creare un'istanza di SpeechSynthesizer e usare il metodo SynthesizeTextToStreamAsync a cui passare il testo da trasformare.
var speechSynth = new Windows.Media.SpeechSynthesis.SpeechSynthesizer(); SpeechSynthesisStream audioStream = await speechSynth.SynthesizeTextToStreamAsync("Benvenuti!"); // media è un MediaElement per riprodurre lo stream audio media.SetSource(audioStream, audioStream.ContentType); media.Play();
Lo stream restituito da SynthesizeTextToStreamAsync può essere semplicemente riprodotto con un oggetto MediaElement.
Le API sono ricche di funzionalità e tra l'altro è supportato il Speech Synthesis Markup Language (SSML): un linguaggio di markup con cui si può dettagliare le caratteristiche del suono, durata, frequenza e altro per ogni singola parola.
Commenti
Per inserire un commento, devi avere un account.
Fai il login e torna a questa pagina, oppure registrati alla nostra community.
Approfondimenti
Sostituire la GitHub Action di login su private registry
Persistere la ChatHistory di Semantic Kernel in ASP.NET Core Web API per GPT
Utilizzare il metodo CountBy di LINQ per semplificare raggruppamenti e i conteggi
Introduzione alle Container Queries
Eseguire una ricerca avanzata per recuperare le issue di GitHub
Usare i servizi di Azure OpenAI e ChatGPT in ASP.NET Core con Semantic Kernel
Miglioramenti nelle performance di Angular 16
Bloccare l'esecuzione di un pod in mancanza di un'artifact attestation di GitHub
Creare un webhook in Azure DevOps
Utilizzare la funzione EF.Parameter per forzare la parametrizzazione di una costante con Entity Framework
Esporre i propri servizi applicativi con Semantic Kernel e ASP.NET Web API
Limitare le richieste lato server con l'interactive routing di Blazor 8