Читайте страницу «Минфина» в фейсбуке: главные финансовые новости

Пользователи смогут выбирать голос в приложении чат-бота, выбирая из пяти персонажей.

Разговор с ChatGPT основан на двух отдельных моделях. Whisper, действующая модель преобразования языка в текст OpenAI, превращает голос в текст, затем передает чат-боту. А новая модель преобразования текста в язык превращает ответы ChatGPT в произнесенные слова.

В демонстрационном ролике, предоставленном компанией ограниченному числу журналистов на прошлой неделе, Джоанна Джанг, продакт-менеджер, продемонстрировала ассортимент синтетических голосов ChatGPT.

Они были созданы путем обучения модели преобразования текста в язык на голосах актеров, нанятых OpenAI. В будущем это может даже дать возможность пользователям создавать собственные голоса.

Эта функция будет доступна людям, подписавшимся на услугу OpenAI ChatGPT Plus за $20 в месяц, и корпоративным пользователям.

OpenAI делится этой моделью преобразования текста в вещание с несколькими другими компаниями, включая Spotify, которая объявила, что использует ту же технологию синтетического голоса для перевода подкастов знаменитостей на несколько языков, которые будут озвучены синтетическими версиями собственных голосов подкастеров.

Также в ChatGPT добавили функцию распознавания изображений. Это означает, что теперь можно загружать изображения в приложение и спрашивать о том, что на них изображено.

По данным Bloomberg, компания надеется, что новая функция будет поощрять использование мобильного приложения на ходу, создавая ему большую конкуренцию с такими предложениями персональных помощников, как Google Assistant, Siri от Apple и Alexa от Amazon.

Напомним

«Минфин» писал, что ChatGPT стал доступен на Android. Для работы чат-бота требуется версия ОС Android 6.0 или выше.