Компания OpenAI представила Sora 2 — обновленную версию своей модели искусственного интеллекта для генерации видео, которая теперь способна создавать реалистичное звуковое сопровождение. Новая модель исправляет ключевые недостатки предшественницы и является прямым ответом на разработки конкурентов, в частности Google. Об этом говорится в официальном сообщении компании.

Что нового в Sora 2: звук, физика и интеграция людей

Обновленная модель получила ряд ключевых улучшений, приближающих сгенерированные видео к реальным.

Синхронизация аудио: в отличие от первой версии, Sora 2 может генерировать полноценное звуковое сопровождение — от диалогов до фоновых шумов, гармонично сочетая его с видеорядом.

Реалистичная физика: устранены проблемы с деформацией объектов и нелогичными движениями. Теперь модель может точно воспроизводить сложные действия, например, спортивные трюки, в соответствии с законами физики.

Функция «камео»: Пользователи могут интегрировать в сгенерированные сцены реальных людей. Для этого достаточно предоставить короткую видео- или аудиозапись, после чего модель может добавить человека в любой ролик, сохранив его голос и естественность движений.

Мобильное приложение и доступ: как попробовать

Вместе с новой моделью OpenAI запустила мобильное приложение Sora для iOS. Оно позволяет создавать, редактировать и распространять видео непосредственно со смартфона и содержит инструменты для защиты контента, в частности возрастные ограничения.

В настоящее время доступ к приложению ограничен:

Оно работает только в США и Канаде.

Попасть можно только по приглашениям (каждый приглашенный может пригласить еще четырех человек).

Информации о версии для Android пока нет.

На старте Sora 2 будет бесплатной, но с определенными лимитами. Подписчики ChatGPT Pro получат доступ к расширенной экспериментальной версии Sora 2 Pro.

Конкуренция с Google: догнать и перегнать

Первая версия Sora, представленная в декабре 2024 года, впечатляла качеством изображения, но была «немой». Это стало ее главным недостатком на фоне конкурента — модели Veo 3 от Google, которая уже тогда умела создавать видео с синхронизированным звуком.

Запуск Sora 2 с аудиогенерацией является стратегическим шагом OpenAI, направленным на то, чтобы не отстать в этой технологической гонке и предложить пользователям полноценный инструмент для создания кинематографического контента.