Google a dezvoltat un sistem de sintetizare a vocii care poate fi confundat cu vocea umană; Este bazat pe AI

Autor:  | Publicat în:  Google 2.024 ori
<b>Google a dezvoltat un sistem de sintetizare a vocii care poate fi confundat cu vocea umană; Este bazat pe AI</b>Descoperim astăzi faptul că cei de la Google au dezvoltat de curând un sistem de sintetizare a vocii care poate fi chiar confundat cu vocea umană se pare. Sistemul poartă numele de Tacotron 2 și suntem informați că acesta are o vorbire

După ce am văzut AI-ul Google pus la treabă în fel şi chip în ultimii ani, acum Marele G îl foloseşte şi pentru sinteza de voce. Cea mai nouă versiune a sistemului său de sintetizare a vorbirii, Tacotron 2 poate fi confundat cu vocea umană.

E aproape imposibil să distingi între o persoană care vorbeşte şi acest Tacotron. Sunt şi exemple comparative aici. Tacotron 2 poate transforma textul scris în voce, iar Google afirmă că e destul de inteligent încât să distingă contextul şi să pronunţe cuvintele care se scriu la fel şi se citesc diferit în mod potrivit (spre exemplu „to read” - a citi și „read” - citit). Îşi dă seama de punctuaţie, poate sublinia cuvinte şi ştie şi accentua silabe.

Această tehnologie de generaţie secundă include două reţele neurale. Prima reţea traduce textul într-o spectrogramă, care este apoi introdusă în WaveNet, un sistem de la laboratorul de cercetare AI de la Alphabet, DeepMind. Acesta citeşte graficul de frecvenţe şi le traduce în elemente audio. Personal mi se pare că mai e puţin de lucru la această voce, ea părând cam "rigidă", cam ca o persoană de sex feminin care să forţează să citească corect un voice over.

Tacotron 3 cred că va putea să imite lejer vocea umană.

Acest site folosește cookies. Prin navigarea pe acest site, vă exprimați acordul asupra folosirii cookie-urilor. Citește mai mult×