► Подписывайтесь на телеграмм-канал«Минфина»: главные финансовые новости
Возможности и версии Voxtral
Новая модель ориентирована на бизнес-пользователей. Она способна транскрибировать (преобразовывать аудио в текст) до 30 минут записи и понимать контекст до 40 минут аудио. Это позволяет не просто расшифровывать, но и задавать вопросы к аудиофайлу, создавать его краткое содержание (резюме) или выполнять действия в реальном времени. Сейчас Voxtral поддерживает восемь языков, в том числе английский, испанский, французский, немецкий и итальянский.
Mistral предлагает несколько версий модели:
- Voxtral Small: большая модель на 24 млрд параметров для масштабного использования.
- Voxtral Mini: Компактная модель на 3 млрд параметров для локального развертывания на устройствах.
- Voxtral Mini Transcribe: Быстрый и дешевый API только для транскрибирования, который, по заявлениям компании, превосходит по производительности и стоимости известный сервис OpenAI Whisper.
Модель уже доступна для бесплатного тестирования через платформу Hugging Face и фирменный чат-бот Le Chat, а стоимость API-интеграции начинается от $0,001 за минуту.
Стратегия Mistral
Французский стартап, стоимость которого венчурные инвесторы оценили в $6,2 млрд, стремится стать независимым европейским лидером в сфере ИИ и конкурировать с разработчиками из США и Китая. Компания, которую поддерживает президент Франции Эммануэль Макрон, делает ставку на открытый исходный код для части своих моделей, в отличие от полностью закрытых систем OpenAI или Google.
«Открытые» и «закрытые» ИИ-модели: в чем разница
Современные большие языковые модели (LLM) делятся на два основных типа в зависимости от их доступности:
- Закрытые модели: Это системы, разработанные крупными корпорациями (например, GPT-4 от OpenAI или Claude 3 от Anthropic). Их исходный код, архитектура и данные для обучения являются коммерческой тайной. Пользователи могут взаимодействовать с ними только через платные программные интерфейсы (API). Они предлагают высокую производительность и надежную поддержку, но ограничивают контроль и возможности настройки.
- Открытые модели: Такие модели, как Voxtral от Mistral или Llama от Meta, публикуются с открытым исходным кодом и «весами» (математическим представлением «знаний» модели). Это позволяет любому разработчику или компании бесплатно загружать их, запускать на собственном оборудовании, модифицировать и глубоко настраивать под свои специфические потребности. Это обеспечивает большую гибкость, контроль над данными и более низкую стоимость, но требует большей технической экспертизы.
Стратегия Mistral заключается в том, чтобы предлагать как передовые закрытые модели для корпоративных клиентов, так и мощные открытые модели для сообщества разработчиков.