"Le monde ne sera pas détruit par ceux qui font le mal, mais par ceux qui regardent et laissent faire !" Albert Einstein

Google créée une voix artificielle indifférenciable d’une voix humaine




Le géant du web a réalisé un véritable tour de force avec Tacotron 2, son dernier moteur de synthèse vocal. La dernière innovation made in Google réussit l’exploit de tromper les oreilles humaines les plus alertes en leur rendant quasi-impossible la différenciation d’une voix humaine d’avec la voix artificielle…

L’information est sortie des colonnes du site Quartz le 28 décembre : Google a créé une voix artificielle ressemblant en tous points à une voix humaine. Une prouesse qui n’a pas manqué de susciter l’intérêt des chercheurs de l’Université de Cornell, qui lui ont consacré une étude publiée le 16 décembre et s’intéressant aux différents rouages du moteur de synthèse.

Plusieurs extraits mis en ligne par la firme américaine, et disponibles sur Github, achèveront de convaincre les plus sceptiques : les différences entre la voix  générée par l’intelligence artificielle et celle d’une femme en chair et en os sont imperceptibles ! Tacotron 2 a tout de l’humain dématérialisé, capable de varier ses intonations pour poser une question, de prononcer à la perfection homonymes et mots compliqués (comme « otolaryngology » ou « auto-correlations”), de respecter la ponctuation, et même de passer outre les fautes d’orthographe !

Les équipes de la firme californienne sont parvenues à imposer Tacotron 2 comme la voix artificielle la plus perfectionné du milieu grâce à « deux réseaux de neurones artificiels », comme nous l’indique Cnet : « Le premier transforme le texte en spectrogramme audio – afin d’avoir une représentation précise du son et de l’intensité du signal – le second décrypte le spectrogramme et le transforme en fichier audio. »

Le site internet ajoute par ailleurs que la voix obtenue via Tacotron 2 remplacera d’ici peu la voix actuellement affiliée aux diverses applications du géant du web. À noter évidemment que les anglophones seront les premiers à bénéficier de cette avancée technologique majeure; le reste du monde devra patienter.