Uneori companiile tech uriaşe creează în laboratoarele lor produse atât de periculoase încât decid să nu le mai lanseze. Este şi cazul celor de la Meta, compania mamă Facebook, care a anunţat un nou model generativ AI, care poate imita la perfecţie vocile.
Personal când aud de imitat fețe şi voci mă gândesc la invazia de deepfake-uri de la anul, când vom avea 3 rânduri de alegeri în România şi alegeri prezidenţiale în SUA. Va fi foarte uşor de propagat pe TikTok un candidat care spune aberaţii şi luat de bun de milioane de oameni. Revenind la proiectul celor de la Meta, acesta e un sistem AI care poate vorbi în 6 limbi.
Meta a decis să nu îl mai lanseze public, din cauza "potenţialului de utilizare tendenţioasă". Produsul se numeşte Voicebox şi aduce o revoluţie în AI-ul generativ pentru limbaj uman. Mă gândesc şi la un episod din "Black Mirror" aici, deoarece un sistem care poate imita vocea cuiva drag ţie care a murit poate fi pus la treabă pentru a crea un companion virtual.
Până una-alta, Meta vede sistemul drept util persoanelor cu deficiențe de vedere, care vor putea asculta mesaje de la prieteni rostite cu vocile lor. E util şi pentru creatorii de conţinut care vor să ajungă la vorbitorii de alte limbi sau la cei care creează asistenţi vocali şi vor să sune mai natural. Voicebox de la Meta aduce cu ChatGPT şi Dall-E doar că generează cuvinte vorbite.
A fost antrenat pe mai bine de 50.000 de ore de audio nefiltrat, în engleză, franceza, germana, spaniolă, poloneză, portugheză. Rezultatul va fi mai conversaţional decât vocile AI clasice. Ar putea schimba industria navigatoarelor GPS cu ghidaj vocal.