► Підписуйтесь на телеграм-канал «Мінфіну»: головні фінансові новини

Історичний рекорд у програмуванні

Головною особливістю релізу стали результати спеціалізованого двогодинного іспиту з інженерії продуктивності ПЗ. Claude Opus 4.5 показала кращі результати, ніж усі кандидати-люди, які проходили цей тест раніше.

Завдання оцінювало не лише знання синтаксису мов програмування, а й «інженерне чуття» та здатність вирішувати складні проблеми в умовах обмеженого часу. Модель досягла успіху завдяки стратегії «мультиспроб»: вона генерувала кілька варіантів вирішення задачі та самостійно обирала найефективніший.

Ціна інтелекту та доступність

Нова модель вже доступна для бізнесу та розробників через API, у фірмових застосунках Claude та на хмарних платформах партнерів.

Цінова політика вказує на преміальний сегмент продукту:

  • $5 за 1 мільйон вхідних токенів (інформація, яку ви завантажуєте в модель).
  • $25 за 1 мільйон вихідних токенів (відповідь, яку генерує ШІ).

Розробники також пообіцяли підвищити ліміти використання для клієнтів, які перейдуть на нову версію.

Ера автономних агентів

Anthropic позиціонує Opus 4.5 не просто як чат-бот, а як потужну платформу для створення автономних агентів. Нова модель здатна:

  • Планувати та виконувати довготривалі завдання (від глибоких досліджень до створення фінансових звітів).
  • Зберігати пам'ять про попередні сесії та використовувати накопичені інсайти в майбутньому.
  • Керувати комп'ютером та координувати роботу «субагентів» для реалізації масштабних проєктів.

Компанія також називає цей реліз «найбезпечнішим» у своїй історії, стверджуючи, що Opus 4.5 значно стійкіша до спроб злому та маніпуляцій, ніж конкуренти.

Нагадаємо, що нещодавно Google представила нову мовну модель Gemini 3, а Alibaba представила нову модель Qwen.