Провідні технологічні компанії, такі як Google DeepMind, Meta та Nvidia, переорієнтовують свої зусилля з розробки мовних моделей на створення «світових моделей» штучного інтелекту. Ці системи здатні навчатися не лише на текстах, а й на відео, що дозволяє їм краще розуміти та взаємодіяти з фізичним світом, відкриваючи нову еру в робототехніці та автономних системах. Про це повідомляє Financial Times 29 вересня.
Нова гонка в ШІ: Google, Meta та Nvidia розробляють «фізичний інтелект» для взаємодії з реальним світом
► Підписуйтесь на телеграм-канал «Мінфіну»: головні фінансові новини
Що таке «фізичний ШІ» і чому він важливий
На відміну від великих мовних моделей (LLM), які обробляють текстову інформацію, «світові моделі» аналізують візуальні дані для прогнозування та моделювання подій у реальному світі. Мета полягає в тому, щоб навчити алгоритми орієнтуватися у фізичному просторі. Це може стати технологічним фундаментом для прориву в галузі самокерованих автомобілів, промислової робототехніки та створення повноцінних ШІ-агентів.
За словами віцепрезидента Nvidia з технологій симуляції Рева Лебаредіана, потенційний ринок для таких систем є колосальним.
«Якщо ми створимо інтелект, здатний розуміти та діяти у фізичному світі, масштаб можливостей буде колосальним», — наголосив він, оцінюючи ринок у $100 трлн, що майже дорівнює обсягу всієї світової економіки.
Хто бере участь у перегонах
Технологічні гіганти вже активно працюють над власними проєктами у цій сфері:
- Google DeepMind у серпні представив модель Genie 3, яка здатна створювати відео покадрово, аналізуючи попередні кадри та взаємодії.
- Meta під керівництвом Яна ЛеКуна розробляє модель V-JEPA, яка навчається на необробленому відеоконтенті, імітуючи процес пізнання світу дитиною.
- Nvidia робить ставку на платформу Omniverse, що симулює фізичні середовища для тренування роботів. Глава компанії Дженсен Хуанг заявив, що наступна ера Nvidia буде пов'язана саме з «фізичним ШІ».
Стартапи також долучаються до гонки. World Labs створює тривимірні ігрові світи з одного зображення, Runway співпрацює з Голлівудом для генерації реалістичних сцен, а Niantic використовує дані з гри Pokémon Go для створення детальної карти світу для навчання своїх систем.
Інвестиції та ризики
Конкуренція у сфері ШІ стимулює величезні інвестиції, проте аналітики попереджають про значні ризики. За даними Morgan Stanley, фінансовий розрив у галузі оцінюється в $1,5 трлн. Прибутки компаній поки що не встигають за витратами, що, на думку деяких інвесторів, перетворює бум ШІ на «спекулятивне божевілля». Попри це, провідні гравці ринку готові йти на масштабну перебудову інфраструктури, оскільки вірять, що штучний інтелект повністю переформатує ринок.
Водночас експерти зазначають, що до створення систем із людським рівнем інтелекту може пройти ще щонайменше десятиліття.
Концепція Яна ЛеКуна: ШІ, що вчиться як людина
Варто додати, що підхід, який просуває головний науковець Meta та один із «хрещених батьків» ШІ Ян ЛеКун, суттєво відрізняється від напрямку розвитку великих мовних моделей, як-от ChatGPT. ЛеКун неодноразово критикував LLM за відсутність справжнього розуміння світу. На його думку, такі моделі лише передбачають наступне слово в реченні, але не здатні до міркування та планування.
Його концепція «світових моделей» полягає у створенні ШІ, який, подібно до людей та тварин, формує внутрішню модель реальності. Це дозволяє системі прогнозувати наслідки своїх дій та ефективно планувати. Архітектура V-JEPA, яку розробляє Meta, якраз і спрямована на те, щоб навчити ШІ створювати такі абстрактні уявлення про світ, аналізуючи відео, а не просто обробляючи текст.
Чому це важливо
Ця новина знаменує собою потенційний зсув у стратегії розвитку штучного інтелекту. Якщо раніше головним полем битви було створення чат-ботів, здатних ідеально імітувати людську мову, то тепер акцент зміщується на наділення ШІ здатністю діяти в реальному світі.
Це крок від цифрового інтелекту до фізичного. Уявіть різницю між ШІ, який може написати інструкцію зі збирання меблів, та ШІ-роботом, який може самостійно ці меблі зібрати, орієнтуючись у просторі та маніпулюючи об'єктами. Успіх у створенні «світових моделей» визначить лідерів наступної технологічної епохи та може кардинально змінити такі галузі, як виробництво, логістика, медицина та побутове життя.
Коментарі - 1