Conversion texte en voix

Le Text To Speech (TTS) est utile pour la bande son de vidéos en post-prodution. Ces services peuvent aussi servir pour relire ses propres textes car on entend clairement les fautes de frappe que l’on ne voit plus de ses propres yeux. Malheureusement, les services libres sont rares et le nombre de caractères admissible est ridiculement petit. 500 caractères ne forment même pas un paragraphe.

Il vaut mieux éviter les voix multilingues (Multilinual) car elles interprètent la langue aux premiers mots d’une phrase seulement. Il se peut donc que le reste de la phrase soit parlé dans une langue quelconque. Exemple: le mot “so” existe en anglais et en allemand mais avec des significations différentes. Une phrase commençant par ce mot est exprimée entièrement en anglais, même si elle est en allemand et même si la langue allemande avait été sélectionné avant.

Uniquement les quatre premiers (speechsynthesis.online, text-to-speech.online, textmagic.com, ttsmaker.com) sont sans limitation d’utilisation.

speechsynthesis.online

C’est la nouvelle version de text-to-speech.online plus bas.

Grands avantages:

  • Pas de limite affiché, mais la conversion coupe vers 7600 caractères. ce qui est toujours très bien. Apparemment pas de quotas.
  • Pas de captchas ou autres confirmations.
  • Pas de publicité (août 2024)

Le problème de reformatage semble résolu, il ne faut plus passer par SSML (mais on peut toujours). Le choix des voix est accru.

Il faut d’abord faire la synthèse de la voix, plus lancer la lecture. C’est donc un peu plus lent.

Voix bien audibles:

  • en français fr-FR: Denise (f) et Herni * (m).
  • en allemand de-DE: Katja (f) et Conrad (m).
  • en anglais en-GB: Mia (f) et Ryan (m).

Téléchargement en fichiers jusqu’à 192kbps sous format mp3 et autres. Les fichiers téléchargés n’ont pas de noms logiques, c’est une suite aléatoire de 32 caractères.

text-to-speech.online

Grands avantages:

  • Limitation à 10000 caractères par conversion ce qui est agréablement large. Apparemment pas d’autres quotas.
  • Lancement de la conversion en un seul click. Pas de captchas ou autres confirmations.
  • La conversion démarre immédiatement.

Certaines parties de l’interface sont en chinois et la langue par défaut est aussi le chinois, mais tout ceci est changeable. Le texte formaté copié-collé est aligné sans paragraphes, cela nuit à la lecture. On peut cependant aussi inclure le texte dans le format Langage de balisage de synthèse vocale (SSML), cela permet de contourner ce problème qui semble aussi venir tout droit de la mise en page chinoise, placer le texte entre les balises <prosody>. Il n’y a pas de curseur et en stoppant la conversion, elle recommencera au début si on la relance. Pas de captchas ou autres confirmations.

Voix bien audibles:

  • en français fr-FR: DeniseNeutral(Female) (f) et HerniNeutral(Male) * (m).
  • en allemand de-DE: KatjaNeutral(Female) (f) et ConradNeutral(Male) (m).
  • en anglais en-GB: LibbyNeutral(Female) (f) et RyanNeutral(Male) (m);

Téléchargement en fichier 96kbps sous format mp3. En texte simple, les noms de fichiers sont formés par les 15 premières lettres du texte. En SSML c’est pareil, sauf que le nom n’est pas changé après le premier téléchargement. C’est sans doute une erreur de programmation.

freetools.textmagic.com/text-to-speech

Grands avantages:

  • Limitation à 2500 caractères par conversion ce qui est agréablement large. Apparemment pas d’autres quotas.
  • La phrase parlée est surligné lors de la conversion

Il faut à chaque fois certifier que l’on est un humain (un click, plus tard photos à sélectionner). Pas de publicité sur la page. Le son est énoncé parallèlement en surlignant le bout de la phrase parlée actuellement.

Durée de conversion acceptable. La qualité sonore convient pour se faire lire, mais sans doute pas pour l’utiliser comme voix off en vidéo.

Voix bien audibles:

  • en français FR: French (France) - Vivian (f) et fr-FR-Standard-G (m).
  • en allemand DE: German (Germany) Sophia (f) et German (Germany) Walter (m).
  • en anglais GB: en-GB-Neutral2-C (f) et en-GB-Studio-B (m); anglais américain en-US-Neutral2-C (f) et English (US) - Philip (m)

Téléchargement en fichier 64kbps sous format mp3. Les noms de fichiers sont uniformes avec date et heure

ttsmaker.com

500 à 2000 caractères en différentes langues. Des textes plus longs sont uniquement disponibles en anglais. Uniquement les voix marqués Unlimited sont utilisables indéfiniment. Quand le texte est trop long, il faut le raccourcir soi-même avant de pouvoir lancer la conversion. Il faut entrer un captcha à chaque requête.

Durée de conversion acceptable. Par défaut, la qualité audio est faible, on peut l’augmenter sous More Settings à gauche du bouton de conversion. Ici se trouvent d’autres options.

Le nombre de caractères était bien plus grand jusqu’au début de l’année 2024. Il n’a actuellement aucun quota sur les voix illimités et il n’y a pas de possibilité de s’enregistrer pour une utilisation gratuite.

Voix bien audibles:

  • en français FR: 256-Dore (f) et 257-Coppin * (m, malheureusement peux de caractères).
  • en allemand DE: 290-Sander (f) et 289-Audwin (m).
  • en anglais US: 148-Alaya (f) et 777-Miles (m, c’est le seul), la voix de 666-Mia (f) dispose d’un maximum de caractères (20000 en juillet 2024).

Téléchargement en fichier 96kbps sous format mp3 et autres. Prendre soin d’augementer la qualité du traitement du son, cela devient bien sûr plus long. Les noms de fichiers sont uniformes avec date et heure

ttsfree.com

500 mots en différentes langues et 2000 mots après être enregistré gratuitement. Quand le texte est trop long, il est coupé net à la valeur indiqué et on peut lancer la conversion sans intervenir soi-même. Il faut parfois entrer un captcha peu lisible.

Longe durée de conversion. Peu de paramètres et l’interace pour le changement de langues n’est pas aisé.

Attention, il y a des quotas qui comptent en arrière plan: 50 conversions par jour sans enregistrement; 100 conversions par jour et 500000 caractères par mois avec enregistrement. Ces limites sont assez larges. Beaucoup de publicités sur la page, même en étant enregistré.

Voix bien audibles, toujours sur “TTS Server 2”:

  • en français FR: Denise (f) et Herni * (m); en français canadien CA: Sylvie (f) et Antoine(m); le français belge BE et le français suisse ne sont pas authentiques.
  • en allemand DE: Katja (f) et Conrad (m), l’allemand autrichien AT n’est pas authentique.
  • en anglais GB: Libby (f) et Thomas (m); en anglais américain US: Aria (f) et Guy (m); l’anglais africain est rendu de manière enfantine.

Téléchargement à tester, quotas atteints.

naturalreaders.com

Differentes langues et voix de bonne qualité. La limite de la conversion libre avec accès à la majorité des fonctions est de 5 minutes. Il n’y a pas d’autre limite de longueur. Après ces cinq minutes, on peut continuer à convertir du texte sans s’engegistrer, mais c’est alors sur une voix plus synthétique et le parametrage est massivement réduit. On peut cependant encore changer de langue à traiter. On peut s’engregistrer, mais sans payer, cela n’apporte pas de nouvelle fonctionnalité.

Durée de conversion rapide. La spécialité est que le son est énoncé parallèlement en surlignant le bout de la phrase parlée actuellement.

Les voix sont bien audibles et belles. On entend cependant des différences d’intonation d’une phrase à l’autre.

Aucun téléchargement de sons sans enregistrement payant.

elevenlabs.io

500 mots en différentes langues. Un quota non expliqué arrive cependant très vite après environ 10000 caractères. On dispose de 5000 après être enregistré gratuitement. Cependant, le quota mensuel est limité à 10000 caractères seulement ce qui correspond à peine à une page de texte. L’offre gratuite est donc très restreinte.

Durée de conversion rapide. Des paramètres de modification de la voix existent, mais ils ne sont pas évidents.

La spécialité du service est que la langue est reconnue automatiquement et le système gère aussi les mots d’une autre langue que le texte principal.

Voix bien audibles dans la version libre et sans enregistrement:

  • en français FR: reste à tester, mais les quotas sont atteints.
  • en allemand DE: Alice (f) et Chris (m).
  • en anglais US: Alice (f) et Chris (m).

Téléchargement à tester, quotas atteints.

ttsmp3.com

Differentes langues et voix. Limites strictes de 3000 caractères avec voix définies et en plus 1000 caractères en voix dite AI. Ces limites valent par jour.

Durée de conversion rapide. Il n’y a pas de paramètres de conversion, mais on peut paramétrer dans le texte avec des balises XML.

Les voix sont audibles, mais pas très belles.

Téléchargement à tester, quotas atteints.

D’autres services TTS

Beaucoup de sites de TTS sont tellement convaincus d’eux qu’ils ne proposent même pas de tester leur qualité, leur fonctionnalité, leurs types de voix et les langues disponibles. Nous ne les énumérons pas ici. Ne pas listés non plus: les services qui marchent sur plugins dans les navigateurs, sur des programmes à installer ou uniquement sur portable. Non plus listés: les sites convertissant moins de 500 caractères à la fois.

  • ttsreader.com limite les conversions à 5000 caractères par jour. Pas de téléchargement sans abonnement payant. Le son est énoncé parallèlement en surlignant le bout de la phrase parlée actuellement.
  • text2speech.org limite les conversions à 4000 caractères. Uniquement anglais, hindi et marathi. Qualité audio médiocre. Appartement pas de quotas. Téléchargement de fichier audio possible
  • text-to-speech.imtranslator.net limite les conversions à 500 caractères, ou phrase par phrase. Voix de mauvaise qualité. Appartement pas de quotas. Pas de téléchargement de fichiers audio.
  • nuance.com/…/text-to-speech… limite la conversion à une minute, mais on peut rentrer plus de texte dans le formulaire, il faut ensuite effacer la partie parlée et relancer la conversion. Qualité de voix moyenne.
  • ttsdemo.com limite les conversions à 600 caractères. Voix de mauvaise qualité. Appartement pas de quotas. Pas de téléchargement de fichiers audio.
  • speechify.com propose environs 1000 caractères en différentes langues disponibles sans enregistrement. Le son est énoncé parallèlement en surlignant le bout de la phrase parlée actuellement. Après la consommation des 1000 caractères, le service devient payant.

*) Nous utilisons cette voix émanant de la bibliothèque vocale Microsoft AI sur notre site YouTube. Elle est appelée Henri par défaut, mais ces noms peuvent changer sur d’autres services.

No Comments

Leave a Comment

This site uses Akismet to reduce spam. Learn how your comment data is processed.