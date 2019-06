Дослідники зі Стенфордського і Прінстонського університетів створили алгоритм, який спотворює мова людини на відео. Для переконливості програма не тільки підлаштовує голос, але і змінює міміку, а також довжину ролика.

Як розповіли розробники, влаштована їхня програма так: з ролика вона виділяє аудіотрек, розділяючи мова людини на фонеми. Далі ЗА створює 3D модель обличчя людини, скануючи, як він рухає губами, вимовляючи слова. Потім машина знаходить висемы — звуки, які виглядають однаково при русі губ — і використовує їх для створення міміки під нові фрази. В результаті з двох вимовлених слів алгоритм створює третє.

Щоб відредагований голос більше скидався на мова моделі, дослідники користуються програмою VoCo, яку вони представили в 2016 році. Проаналізувавши невеличкий монолог людини, вона здатна «спародіювати» його голос.

В ознайомчому ролику дослідники показали демоверсію розробки. Наприклад, одного диктора вони «змусили» говорити French toast замість Napalm в реченні I love the smell of napalm in the morning. Іншого диктора і зовсім позбавили одного слова — програма також вміє видаляти мова з ролика.

Як повідомляв «Навколо Світу. Україна», вчені з США навчили алгоритм розпізнавати «мова» щурів.

За матеріалами Knife.media

