► Подписывайтесь на телеграмм-канал«Минфина»: главные финансовые новости

Национальная языковая модель: что это и зачем

Как пояснили в министерстве, большая языковая модель (LLM) является технологическим фундаментом для ИИ-помощников и голосовых ассистентов. Ключевое преимущество украинской модели будет заключаться в том, что она будет обучена на украинских данных, в частности на законодательстве, научных работах и данных библиотек. Это позволит ей «понимать национальный контекст и давать более качественные ответы, чем глобальные модели».

По словам Михаила Федорова, потенциал применения такой модели очень широк, в частности в сфере обороны — например, для обучения на фото с поля боя и декодирования спутниковых снимков.

Безопасность и суверенитет

Министр отметил, что уже около десятка стран начали создавать собственные суверенные LLM, чтобы иметь возможность влиять на них и контролировать их обучение. Это, по его мнению, является важным шагом для защиты информационного пространства, в частности от российского ИПСО.

В Минцифры заверили, что все данные для обучения и работы модели будут обрабатываться и храниться внутри Украины, что является стратегически важным для ее использования в обороне, медицине и правительственных структурах. Для контроля за безопасностью и качеством модели при министерстве создадут координационный комитет, а также этический и технический советы.

Сроки и доступность

Запуск бета-версии национальной LLM запланирован до конца 2025 года. После завершения этапа тестирования модель станет доступной для всех украинцев и бизнеса. Ожидается, что использование отечественного ИИ будет дешевле по сравнению с иностранными аналогами, хотя, по словам Федорова, проект не ставит целью прямую конкуренцию с ChatGPT.

Что такое большие языковые модели (LLM)

Большая языковая модель (Large Language Model, LLM) — это тип искусственного интеллекта, обученный на гигантских массивах текстовых данных. Благодаря этому обучению модель способна понимать человеческую речь, генерировать осмысленные тексты, отвечать на вопросы, переводить и выполнять другие языковые задачи. Именно LLM является технологической основой таких известных чат-ботов, как ChatGPT от OpenAI и Gemini от Google. Качество и «мировоззрение» модели напрямую зависят от данных, на которых ее тренировали.