Multi від Мінфін
(8,9K+)
Оформи кредит — виграй iPhone 16 Pro Max!
Встановити
16 липня 2025, 11:48

Французький ШІ-стартап Mistral представив аудіомодель Voxtral, що вдвічі дешевша за конкурентів

Французький ШІ-стартап Mistral представив свою першу аудіомодель із відкритим кодом під назвою Voxtral. Новий продукт кидає виклик закритим системам від таких гігантів, як OpenAI, ElevenLabs та Google, пропонуючи бізнесу доступну альтернативу, що коштує менш ніж половину ціни конкурентів. Про це пише видання TechCrunch.

► Підписуйтесь на телеграм-канал «Мінфіну»: головні фінансові новини

Можливості та версії Voxtral

Нова модель орієнтована на бізнес-користувачів. Вона здатна транскрибувати (перетворювати аудіо на текст) до 30 хвилин запису та розуміти контекст до 40 хвилин аудіо. Це дозволяє не просто розшифровувати, а й ставити запитання до аудіофайлу, створювати його короткий зміст (резюме) чи виконувати дії в реальному часі. Наразі Voxtral підтримує вісім мов, зокрема англійську, іспанську, французьку, німецьку та італійську.

Mistral пропонує кілька версій моделі:

  • Voxtral Small: Велика модель на 24 млрд параметрів для масштабного використання.
  • Voxtral Mini: Компактна модель на 3 млрд параметрів для локального розгортання на пристроях.
  • Voxtral Mini Transcribe: Швидке та дешеве API лише для транскрибування, яке, за заявами компанії, перевершує за продуктивністю та вартістю відомий сервіс OpenAI Whisper.

Модель вже доступна для безкоштовного тестування через платформу Hugging Face та фірмовий чат-бот Le Chat, а вартість API-інтеграції починається від $0.001 за хвилину.

Стратегія Mistral

Французький стартап, вартість якого венчурні інвестори оцінили в $6,2 млрд, прагне стати незалежним європейським лідером у сфері ШІ та конкурувати з розробниками зі США та Китаю. Компанія, яку підтримує президент Франції Еммануель Макрон, робить ставку на відкритий вихідний код для частини своїх моделей, на відміну від повністю закритих систем OpenAI чи Google.

«Відкриті» та «закриті» ШІ-моделі: у чому різниця

Сучасні великі мовні моделі (LLM) поділяються на два основні типи залежно від їхньої доступності:

  • Закриті моделі: Це власницькі системи, розроблені великими корпораціями (наприклад, GPT-4 від OpenAI або Claude 3 від Anthropic). Їхній вихідний код, архітектура та дані для навчання є комерційною таємницею. Користувачі можуть взаємодіяти з ними лише через платні програмні інтерфейси (API). Вони пропонують високу продуктивність та надійну підтримку, але обмежують контроль та можливості для налаштування.
  • Відкриті моделі: Такі моделі, як Voxtral від Mistral або Llama від Meta, публікуються з відкритим вихідним кодом та «вагами» (математичним представленням «знань» моделі). Це дозволяє будь-якому розробнику чи компанії безкоштовно завантажувати їх, запускати на власному обладнанні, модифікувати та глибоко налаштовувати під свої специфічні потреби. Це забезпечує більшу гнучкість, контроль над даними та нижчу вартість, але вимагає більшої технічної експертизи.

Стратегія Mistral полягає в тому, щоб пропонувати як передові закриті моделі для корпоративних клієнтів, так і потужні відкриті моделі для спільноти розробників.

Весь ринок інвестицій України — в одному каталозі. Порівнюйте та обирайте проєкти на InvestMarket від «Мінфін»

Автор:
Ярослав Голобородько
Редактор стрічки новин, журналіст Ярослав Голобородько
Пише на теми: макроекономіка, фінанси, банки, інвестиції, фондові та валютні ринки, криптовалюта

Коментарі - 1

+
0
Kidav
Kidav
16 липня 2025, 13:09
#
Можє и депутатів змінити на ШІ?
Щоб залишити коментар, потрібно увійти або зареєструватися