OpenAI запустила GPT-5: что умеет новая модель ИИ

► Читайте «Минфин» в Instagram: главные новости об инвестициях и финансах

От «умных ответов» к выполнению задач

Если GPT-4 разрешал чат-ботам давать разумные ответы на широкий спектр вопросов, то GPT-5 дает ChatGPT возможность выполнять множество задач от имени пользователей. Среди них — генерирование программных приложений, навигация в календаре пользователя или создание аналитических отчетов.

OpenAI также стремилась сделать ChatGPT более простым в использовании с GPT-5. Вместо того чтобы просить пользователей выбирать нужные настройки, GPT-5 оснащен маршрутизатором реального времени, который сам решает, как дать лучший ответ: быстро отреагировать на вопрос или потратить дополнительное время на «размышления» над ответом.

Амбиции Сэма Альтмана

На брифинге для журналистов генеральный директор OpenAI Сэм Альтман заявил, что это значительный шаг на пути компании к разработке ИИ, который сможет превзойти человека в большинстве работ, приносящих экономическую пользу, то есть к созданию искусственного общего интеллекта (AGI), сообщает TechCrunch.

«Иметь что-то вроде GPT-5 было бы практически невозможно в любой предыдущий период истории», — сказал Альтман.

С четверга GPT-5 доступен всем бесплатным пользователям ChatGPT как модель по умолчанию. Вице-президент OpenAI из ChatGPT Ник Терли отметил, что это часть усилий компании, чтобы впервые предоставить бесплатным пользователям доступ к модели ИИ с расширенными возможностями мышления. Ранее такие продвинутые модели были доступны только по платной подписке.

Высокие ожидания

Ожидания GPT-5 очень высоки, ведь это один из самых ожидаемых продуктов OpenAI с момента запуска ChatGPT в 2022 году, который сделал компанию известной. С тех пор ChatGPT стал одним из самых популярных потребительских продуктов в мире, еженедельно достигая более 700 миллионов пользователей — почти 10% населения планеты, по данным компании.

Многие рассматривают GPT-5 как индикатор прогресса ИИ в целом, и его восприятие в Кремниевой долине может иметь глубокие последствия для крупных технологических компаний, Уолл-Стрит и политиков, регулирующих технологии.

Сравнение с конкурентами

OpenAI утверждает, что GPT-5 является передовой моделью в нескольких отраслях, немного опережая ведущие модели ИИ от Anthropic, Google DeepMind и xAI Илона Маска по ключевым показателям. Однако в некоторых других областях GPT-5 несколько уступает другим передовым ИИ-моделям.

Компания заявляет, что GPT-5 обеспечивает передовой уровень производительности программирования. Альтман сказал, что модель особенно отмечается в быстром развертывании целых программных приложений по требованию, ставшему известным как «вайб-кодинг».

На тесте SWE-bench Verified (испытание реальных задач программирования по GitHub) GPT-5 набрал 74,9% с первой попытки. Это немного превосходит последнюю модель Anthropic Claude Opus 4.1 (74,5%) и Google DeepMind Gemini 2.5 Pro (59,6%).

Humanity's Last Exam (сложный тест, измеряющий производительность ИИ-моделей в математике, гуманитарных и естественных науках) версия GPT-5 с расширенными возможностями мышления (GPT-5 Pro) набрала 42% при использовании инструментов. Это немного меньше, чем удалось достичь xAI с Grok 4 Heavy, набравшей 44,4% на этом тесте.

На GPQA Diamond (тест по научным вопросам уровня PhD) GPT-5 Pro набрал 89,4% первой попытки, опередив Claude Opus 4.1 (80,9%) и Grok 4 Heavy (88,9%).

OpenAI заявляет, что GPT-5 лучше подходит для ответов на вопросы, связанные со здоровьем. На тесте, измеряющем точность ответов ИИ-моделей на медицинские темы (HealthBench Hard Hallucinations), OpenAI утверждает, что GPT-5 (с функцией мышления) галлюцинирует только в 1,6% случаев. Это значительно ниже, чем у предыдущих моделей GPT-4o (12,9%) и o3 (15,8%).

Хотя чат-боты ИИ не являются медицинскими работниками, миллионы людей используют их для получения советов по здоровью. В ответ на это явление компания заявляет, что GPT-5 более активно обозначает потенциальные проблемы со здоровьем и помогает пользователям разбираться в медицинских результатах.

Кроме того, OpenAI утверждает, что GPT-5 превосходит другие ИИ-модели в более сложных измерениях, субъективных сферах, таких как креативный дизайн и письмо. Терли отметил, что GPT-5 отвечает более естественно и демонстрирует «лучший вкус» по сравнению с другими моделями ИИ в творческих задачах.

«Ощущения от этой модели действительно очень хорошие», — сказал Терли.

Уменьшение «галлюцинаций» и улучшение безопасности

GPT-5 также точнее предыдущих моделей OpenAI, и компания заявляет, что он значительно меньше страдает от «галлюцинаций» — склонности ИИ-моделей придумывать информацию — по сравнению с моделями серии «о».

Ранее «галюцинации» казалось ухудшавшимися в последних моделях ИИ-мышления OpenAI, таких как o3, и OpenAI ранее заявляла, что не совсем понимает, почему это происходит.

В ответах на запросы ChatGPT OpenAI обнаружила, что GPT-5 (с функцией «мышления») «галюцинирует» и соответствует неверной информацией в 4,8% случаев. Это значительное снижение по сравнению с o3 (22%) и GPT-4o (20,6%) на том же тесте.

На тесте Tau-bench, измеряющем способность ИИ-модели как агента выполнять симулированные онлайн-задачи, GPT-5 демонстрирует неоднозначную производительность.

В части теста, измеряющего способность ИИ ориентироваться на сайте авиакомпании, GPT-5 набрал 63,5%, немного уступив o3 (64,8%). В другой части теста, проверяющего способность ИИ ориентироваться на сайтах розничной торговли, GPT-5 набрал 81,1%, уступив Claude Opus 4.1, получивший 82,4%.

OpenAI также заявляет, что GPT-5 безопаснее предыдущих моделей. Хотя модели ИИ-мышления иногда проявляют склонность к заговору против людей или лжи для достижения собственных целей, OpenAI обнаружила, что GPT-5 был обманчив на более низком уровне, чем другие модели.

Алекс Бойтел, руководитель отдела исследований безопасности OpenAI, заявил, что GPT-5 лучше различает запросы, пытающиеся злоупотреблять ChatGPT, и пользователей, делающих безвредные запросы.

Это приводит к тому, что GPT-5 может отказывать в большем количестве опасных вопросов, предлагая меньшее количество отказов пользователям, которые ищут безвредную информацию.

Обновления для пользователей и разработчиков

ChatGPT получает несколько обновлений пользовательского опыта в рамках запуска GPT-5. Теперь пользователи могут выбирать из четырех новых «личностей» в настройках ChatGPT: «Циник», «Робот», «Слушатель» и «Ботан».

По словам компании, эти режимы будут менять стиль ответов ChatGPT без необходимости отдельно просить модель соответствовать определенным образом.

Подписчики плана ChatGPT Plus ($20 в месяц) получат более высокие лимиты использования GPT-5, чем бесплатные пользователи. В то же время подписчики плана Pro ($200 в месяц) получат неограниченный доступ к GPT-5, а также к «прокаченной» версии под названием GPT-5 Pro, которая использует дополнительные вычислительные ресурсы для предоставления лучших ответов.

Организации с планами OpenAI Team, Edu и Enterprise получат доступ к GPT-5 в качестве своей модели по умолчанию на следующей неделе.

Для разработчиков GPT-5 будет доступен в API OpenAI в трех вариантах — gpt-5, gpt-5-mini и gpt-5-nano — которые будут тратить больше или меньше времени на «мышление» над задачами. Разработчики также теперь могут контролировать «многословие» в API OpenAI, решая, насколько длинными или короткими должны быть ответы модели ИИ.

Базовая модель GPT-5 будет стоить разработчикам $1,25 за миллион входных токенов (примерно 750 000 слов, дольше, чем вся серия «Властелин колец») и $10 за миллион выходных токенов.

Автор:

Роман Мирончук