Компанията OpenAI, която стои зад ChatGPT, напоследък е на гребена на вълната. Разбира се, успехът на ChatGPT е поразителен, но наскоро компанията обяви и Sora - система, която може да създава 60-секундни видеоклипове, изглеждащи много реалистично. Сега компанията обяви нова система, наречена Voice Engine, която може да пресъздава човешки гласове.
Подобно на Sora, OpenAI не позволява на обществеността да използва Voice Engine - поне засега. Засега компанията тества системата частно с "малка група фирми". Очевидно причината за това са огромните етични последици от система, която може да имитира гласа на истински човек.
The New York Times направи демонстрация на системата и сподели няколко клипа. Първият клип е 16-секунден запис на истински мъж с плътен португалски акцент. Той се представя и казва, че прави този клип, за да "помогне на невербалните лица да се изразяват по-пълноценно". Следващият клип е възстановка на гласа му от Voice Engine, който казва нещо съвсем различно. Друг клип показва пресъздаване на гласа на мъжа, но говори на португалски вместо на английски.
И двата клипа на Voice Engine не звучат по същия начин като оригиналния клип. Те обаче са достатъчно близки, за да заблудят някого, който познава гласа на този човек, че той наистина е казал тези неща.
Плашещото в случая е потенциалът за използване на подобен инструмент за разпространение на дезинформация. Гласовете на политици, известни личности и журналисти лесно биха могли да бъдат използвани от Voice Engine и след това да бъдат накарани да кажат всичко, което някой поиска. Кой знае какво може да се направи с малко редактиране и убедителна видеопиеса?
По света се използват и системи за гласова идентификация за целите на сигурността. Много е възможно Voice Engine да позволи на хората да заблудят тези системи, излагайки на риск чувствителна информация.
Продуктовият мениджър на OpenAI Джеф Харис заяви: "Това е деликатна тема и е важно да се справим правилно". OpenAI експериментира със системи за водни знаци, които да помогнат за разграничаване на действителните записи от синтетичните. Екипът е открит и по отношение на етичните проблеми, които тази система поражда.
Въпреки това той също така твърди, че Voice Engine може да направи много добри неща. Например хора, които някога са можели да говорят, но са загубили гласа си по-късно в живота, биха могли да започнат да общуват отново, използвайки факсимиле на собствения си глас. Физикът Стивън Хокинг е известен пример за човек, който би могъл да се възползва от подобна гласова услуга. Voice Engine може също така да съхрани гласовете на хора, които вече не са живи, и да работи в много търговски среди, например при създаването на аудиокниги.
OpenAI заявява, че все още няма планове за публично внедряване на Voice Engine. Подобно на Sora, компанията иска само да демонстрира какво може да прави.