► Читайте телеграмм-канал «Минфина»: главные финансовые новости

Умная компактность: как это работает?

TranslateGemma выпущена в трех размерах: 4B, 12B и 27B параметров. Благодаря специальному двухэтапному обучению (дистилляции знаний по флагманским моделям Gemini), разработчикам удалось добиться уникальной плотности интеллекта:

  • Превосходя гигантов: Модель среднего размера (12B) во время тестов показала лучшие результаты, чем базовая модель Gemma 3 на 27B параметров.
  • Для мобильных устройств: Самая маленькая версия (4B) демонстрирует производительность на уровне значительно более тяжелых аналогов, что делает ее идеальной для использования непосредственно на смартфонах.

Ключевые возможности:

  • 55 языковых пар: Модели прошли тщательную проверку на большом количестве языковых семейств, значительно снизив уровень ошибок по сравнению с предыдущими версиями.
  • Перевод текста на изображениях TranslateGemma сохраняет мультимодальные способности Gemma 3. Она может переводить текст, размещенный на фото или картинках, даже без специального дополнительного обучения.

Гибкость развертывания:

  • 4B: для мобильных устройств;
  • 12B: для работы с ноутбуками;
  • 27B: для облачных вычислений и максимальной точности.

Инструмент для исследователей

Кроме основных 55 языков Google заложила в систему базу для работы с почти 500 дополнительными языковыми парами. Это делает TranslateGemma мощным фундаментом для ученых и разработчиков, желающих создавать переводчики для редких диалектов или узкоспециализированных отраслей.

Благодаря открытому коду новые модели уже доступны для мирового сообщества, что позволит значительно улучшить качество автоматического перевода в программах, которыми мы пользуемся ежедневно.

Загрузить модели TranslateGemma можно на Kaggle и Hugging Face.

Напомним

«Минфин» писал, что OpenAI запустила ChatGPT Translate, бета-версия которого работает бесплатно на базе ШИ моделей. Официального анонса от OpenAI пока не было, но ChatGPT Translate уже доступен пользователям на отдельном сайте.