Нейросеть создала голос, который смог обмануть алгоритмы и людей

Нейросеть создала голос, который смог обмануть алгоритмы и людей

Поделиться

В Чикагском университете исследователи под руководством Эмили Венгер создали нейросеть, синтезирующую речь человека. Сгенерированный ею голос обманул системы распознавания речи и даже других людей.

Идентификация пользователя по голосу сейчас используется во множестве систем, например, в умных колонках Яндекса, сервисе WeChat и так далее. В процессе их создания разработчики ориентировались на то, что голос человека уникален и являет собой надежное средство для идентификации личности.

Однако это утверждение было опровергнуто авторами новой работы. Они решили проверить, как хорошо алгоритм сможет подстроиться под определенный тембр и интонацию. Разработчики ориентировались на ситуации, когда злоумышленник смог получить доступ к образцам голоса человека в виде публично доступных аудио или видеозаписей или же записи речи при живом общении.

Общая длина всей записи составляла не более 5 минут. На основе этого файла злоумышленник мог дополнительно обучить алгоритм до желаемого результата. Использовать при этом можно было только публично доступные алгоритмы, из которых авторы выбрали два – это SV2TTS и AutoVC. Для обучения моделей они использовали записи речи 90 людей из трех публичных баз данных – VCTK, LibriSpeech и SpeechAccent. Как сообщает Хайтек, в процессе тестирования наиболее успешными оказались модель SV2TTS и датасет VCTK.

Чтобы проверить полученные результаты в WeChat и с голосовым ассистентом Alexa, исследователи привлекли 14 добровольцев. Так, они сначала обучали модель своему голосу, а затем проверяли систему на синтезированных записях. В результате 9 из 14 человек удалось войти в WeChat, а виртуального помощника Alexa по итогу обмануть смогли все. Также при разговоре с алгоритмом испытуемые не смогли отличить настоящую речь от сгенерированной нейросетью в 50% случаев.

Что такое нейросеть

Добавить комментарий

Вы должны зайти как в для комментирования записи