Два года назад Илон Маск предложил двум 22-летним студентам миллионный контракт, чтобы привлечь их в свою компанию xAI. Уильям Чен и Гуань Ван, друзья со школьных времен в Мичигане, сделали то, что большинство назвало бы безумием — они отказались от денег самого богатого человека в мире.
Двое студентов отказались от работы на Илона Маска и создали ИИ, который превзошел модели OpenAI и Anthropic
► Подписывайтесь на телеграм-канал «Минфина»: главные финансовые новости
Вместо работы на техногиганта, они решили пойти своим путем и создать искусственный интеллект, который работает по принципу человеческого мозга. И теперь их стартап Sapient Intelligence демонстрирует результаты, превосходящие модели от OpenAI и Anthropic в тестах на абстрактное мышление. Об этом пишет Fortune.
OpenChat: первый успех и письмо от Маска
Все началось в лаборатории мозга Университета Цинхуа в Пекине. Чен и Ван создали OpenChat — небольшую языковую модель, которую тренировали не на гигантских массивах данных из интернета, а на маленьком, тщательно отобранном наборе качественных диалогов. Ключевой фишкой стало использование обучения с подкреплением (RL), когда система учится на собственных ошибках, как живое существо.
Их проект «взорвал» научные круги, доказав, что качество данных важнее их количества. Именно тогда они получили предложение от Маска, который искал таланты для xAI.
«Мы решили, что большие языковые модели имеют свои ограничения. Мы хотели новую архитектуру, которая преодолеет структурные ограничения масштабного машинного обучения», — объяснил Чен причину отказа.
HRM: прорыв в 3 часа ночи
Ребята верили, что путь к настоящему искусственному интеллекту (AGI) лежит не через увеличение размеров моделей, а через изменение их архитектуры. Так родилась модель HRM (Hierarchical Reasoning Model).
Прорыв произошел в июне 2024 года. В 3 часа ночи Чен и Ван увидели результаты тестов своего экспериментального прототипа. Крошечная модель на 27 миллионов параметров (это микроскопический размер по сравнению с GPT-4) обошла гигантов индустрии в задачах на логику:
- Решила сложные судоку (Sudoku-Extreme).
- Нашла оптимальные пути в лабиринтах 30×30.
- Показала впечатляющие результаты в бенчмарке ARC-AGI.
Как это работает: мышление вместо угадывания
В отличие от трансформеров (архитектура GPT), которые просто предсказывают следующее слово на основе статистики, HRM имитирует работу человеческого мозга. Она имеет двухуровневую структуру, сочетающую «медленное» глубокое мышление с «быстрыми» рефлекторными реакциями.
«Это не угадывание. Это мышление», — говорит Чен.
По его словам, их модель значительно реже «галлюцинирует» (выдумывает факты) и уже показывает результаты уровня state-of-the-art в прогнозировании погоды, трейдинге и медицине.
Будущее Sapient
Сейчас основатели готовятся открыть офис в США и привлечь новое финансирование. Их главный тезис остается радикальным: AGI (общий искусственный интеллект, равный человеческому) невозможно создать, просто добавляя больше вычислительной мощности к старым моделям. Будущее — за эффективными, «мозгоподобными» архитектурами.
Почему это важно
История Чена и Вана разрушает миф о том, что для создания прорывного ИИ нужны миллиарды долларов и дата-центры размером с город. Она доказывает, что в эпоху гигантов (Google, OpenAI, Microsoft) все еще есть место для «гаражных» инноваций, если они основаны на гениальной идее, а не на грубой силе вычислений.
Комментарии