Компания OpenAI постепенно начала открывать доступ к новому режиму озвучивания в чат-боте ChatGPT. Пока функция доступна лишь некоторым пользователям, оформившим подписку на ChatGPT Plus.
Возможности нового голосового режима ChatGPT были показаны еще в мае 2024-го года – тогда инженеры продемонстрировали, что бота можно прерывать во время ответа, чтобы уточнить детали или попросить его озвучить рассказ иначе – например, более экспрессивно или другим голосом.
Изображение: OpenAI
Первоначально запуск альфа-версии был запланирован на конец июня, но OpenAI пришлось перенести его на месяц. Представитель компании Тая Кристиансон пояснила, что за это время была улучшена способность нейросети распознавать и отклонять определенный контент.
Как пишут в The Verge, в бот были добавлены фильтры, блокирующие запросы на генерацию аудио, защищенного авторством. Также после пилотной демонстрации новый голос чат-бота, получивший название Sky, вызвал ассоциации со Скарлетт Йохансон и ее персонажем из фильма «Она». В итоге OpenAI приняла решение интегрировать в проект только четыре голоса, принадлежащие профессионалам озвучки, исключив возможность для чата имитировать голоса реальных людей.
По словам Кристиансон, перед запуском новый голосовой режим был протестирован более чем 100 внешними специалистами по кибербезопасности, чтобы выявить и устранить возможные уязвимости. Это было особенно важно на фоне возросшей критики в адрес OpenAI в части обеспечения безопасности ее технологий.
Компания планирует сделать продвинутый голосовой режим доступным для всех пользователей ChatGPT Plus в течение осени.