Еще недавно бизнес видел в ИИ способ сократить расходы, уволить часть штата и получить «производительность без зарплат». Эта идея отлично продавалась инвесторам. Однако в 2026 году возник неудобный вопрос: что делать, если ИИ действительно работает, но стоит значительно дороже, чем ожидали? Ведь платить приходится не за красивые обещания, а за реальные токены, серверы, интеграцию и исправление ошибок.
Неприятная правда об ИИ: почему за экономию на людях компании переплачивают тысячи
Эйфория замены людей
За последние два года крупные компании не раз объясняли сокращения тем, что часть процессов теперь можно автоматизировать. Где-то речь шла прямо о замене людей ИИ, где-то — осторожнее, о «повышении эффективности». Но общая логика везде была одинаковой: один сотрудник с доступом к Copilot, Claude или ChatGPT якобы может выполнять работу команды.
Читайте также: Заберет ли ИИ вашу работу: кто в зоне риска уже сегодня
И эта история касается не только IT. ИИ используют в банках, медиа, ритейле, HR, юридических отделах, поддержке клиентов, маркетинге. По данным McKinsey, еще в 2025 году 88% опрошенных организаций уже регулярно использовали AI хотя бы в одной бизнес-функции.
Но за громкими лозунгами об эффективности, продуктивности и скорости скрывается и менее удобная часть истории. ИИ действительно может ускорять работу, но он не работает «бесплатно» даже после покупки подписки.
Токены вместо зарплат
Самая болезненная часть AI-расходов — это токены. В классическом софте бюджет можно легко посчитать заранее. Есть лицензия на пользователя, ежемесячная оплата, контракт на год. В генеративном ИИ компания платит за то, сколько данных модель получила, сколько текста сгенерировала и сколько раз агент повторил задачу, прежде чем дошел до результата.
На первый взгляд токены довольно дешевые. Но бизнес платит не за один токен и даже не за один миллион. Он платит за сотни миллионов, миллиарды, а в отдельных случаях — за десятки миллиардов токенов в месяц. Так, Сэм Альтман недавно сказал, что крупнейший потребитель токенов в OpenAI использует около 100 млрд токенов в месяц, и это далеко не самый большой показатель в мире.
| Провайдер / модель | Цена за 1 млн входящих токенов | Цена за 1 млн исходящих токенов |
| OpenAI GPT-5.5 | $5 | $30 |
| OpenAI GPT-5.4 | $2,5 | $15 |
| OpenAI GPT-5.4 mini | $0,75 | $4,5 |
| Claude Opus 4.8 / 4.7 / 4.6 | $5 | $25 |
| Claude Sonnet 4.6 / 4.5 | $3 | $15 |
| Claude Haiku 4.5 | $1 | $5 |
| Gemini 3 Flash Preview | $0,5 | $3 |
| Gemini 3.1 Pro | $1−2 | $6−9 |
| Mistral Large | $0,5 | $1,5 |
| Codestral | $0,3 | $0,9 |
| Mistral Small / Devstral Small | $0,1 | $0,3 |
С человеком расходы понятнее. Сотрудник получает зарплату за месяц, и она не растет после каждого дополнительного абзаца, файла или уточнения. Более того, многим знакома ситуация, когда сложную задачу доделывают после рабочего дня или в выходные просто потому, что нужно закрыть дедлайн и сделать нормально.
ИИ работает иначе. Его оплата практически идеально «справедлива» — тот случай, когда сотрудник не дает себя недооценить. Каждый фрагмент информации, каждая новая попытка и каждое исправление имеют свою цену. При этом компания платит не только за хороший ответ, но и за слабый, ошибочный или лишний. Если результат не подошел, его нельзя просто вернуть на бесплатную доработку. Нужно уточнить запрос, снова прогнать модель и снова заплатить.
Именно поэтому финансовым директорам все сложнее контролировать AI-расходы. В свежем анализе The Wall Street Journal писал, что компании сталкиваются с проблемой нового типа: использование ИИ растет быстрее, чем способность финансовых команд его измерять. По данным KPMG, которые приводит издание, только 26% компаний полностью понимают свои расходы на AI.
Особенно дорогими становятся агенты, которые не просто отвечают на запрос, а выполняют последовательность действий: читают файлы, ищут ошибки, переписывают код, запускают тесты, снова анализируют результат. Исследование arXiv также показывает, что агентные задачи в программировании могут потреблять в тысячи раз больше токенов, чем обычный чат с моделью. Еще хуже то, что расходы на одну и ту же задачу могут отличаться в десятки раз, а большее количество токенов не гарантирует лучшего ответа.
Скрытая цена внедрения
Есть еще один пласт расходов. ИИ не интегрируется в компанию сам по себе. Ему нужны данные, доступы, интеграции с CRM, почтой, таск-трекерами, базами знаний и внутренними правилами. Также компания платит за серверы или облачные ресурсы, где хранятся данные, работают внутренние инструменты и обрабатываются запросы. Нужны люди, которые все это настраивают, поддерживают, ведут бюджет, обучают сотрудников, следят за безопасностью и вовремя оплачивают сервисы. Потому что если кредиты заканчиваются, останавливается часть или даже весь рабочий процесс.
А дальше начинается контроль качества. Компании нужны не только специалисты по ИИ, но и эксперты в самой отрасли. Юрист должен проверить юридический текст, редактор — материал, разработчик — код, финансовый аналитик — расчеты. ИИ может ускорить черновую работу, но не отменяет ответственности за результат.
Когда гиганты начинают считать
Показательный кейс — Uber. По данным Forbes, компания исчерпала годовой AI-бюджет 2026 года уже к апрелю после быстрого распространения Claude Code среди примерно 5000 инженеров. Инструмент был популярным, им активно пользовались, продуктивность якобы росла. Проблема заключалась в том, что финансовая модель не поспела за реальным потреблением.
Microsoft тоже начала откатывать часть внутреннего использования Claude Code. The Verge сообщил, что компания отменяет большинство лицензий и переводит инженеров на GitHub Copilot CLI. Официально речь идет о стандартизации инструментов, но источники издания связывают решение также с финансами: дедлайн совпал с завершением финансового года Microsoft.
Даже Nvidia, которая зарабатывает на AI-буме больше большинства участников рынка, признает проблему с расходами. Вице-президент компании Брайан Катанзаро, по данным TechSpot, сказал, что для его команды стоимость вычислений уже значительно превышает стоимость самих сотрудников.
Экономия есть, но она не автоматическая
Это не означает, что ИИ невыгоден. Эффективность действительно есть: модели ускоряют кодинг, работу с текстами, анализ документов, поддержку клиентов и многие рутинные задачи. Но эта эффективность не бесплатная и не такая дешевая, как может казаться.
Поэтому компаниям не стоит спешить увольнять людей и бездумно переносить работу на ИИ. Сначала нужно понять, какие процессы действительно можно автоматизировать, сколько это будет стоить и кто будет контролировать результат. Оптимизировать придется не только работу людей, но и сами AI-расходы: лимиты, модели, запросы, повторные попытки, качество данных и облачные ресурсы.
И все это тоже должны делать люди. Они решают, где ИИ экономит время, а где просто создает новые расходы. Они проверяют ответ, берут на себя ответственность за результат и понимают контекст, которого нет у модели.
Комментарии - 25
На моей памяти еще года 4 назад инфлюенсеры с энтузиазмом рассказывали что через пару лет почти всех программистов заменит ИИ. Ну и что, заменил? Ничего подобного. А те увольнения что есть — на 90% связаны с другими макроэкономическими факторами. А компании, которые поувольняли на волне хайпа — вскоре начали набирать людей снова, если не на те же, то на смежные позиции, уже связанные с самим ИИ. Зато появились новые, более продвинутые инструменты для работы.
Далі, для себе можна багато чого нагенерувати. Я собі теж погенерував деякі речі в рази швидше ніж писав би руками. Тільки якби я не вмів програмувати, і не розумів як коректно ставити задачу та де шукати причини чому не працює, то це було б далеко не так ідеально.
А коли мова йде про продакшен — то ось це все так просто не викладеш без перевірки, бо хтось має за це відповідати. І відповідати буде не ШІ, який завжди просто говорить щось на зразок «Вибач, помилився, давай зробимо інакше». А коли доходить до код ревью, то все не так швидко. І при виникненні проблем пошук причин перетворюється на задачу, яка займає на порядок більше часу, ніж коли люди писали б самі, особливо коли пофіксати треба терміново, бо ніхто ж не знає як це працює. Це все відомі нюанси, з якими зіткнулись вже багато хто, хто максимально перейшов на ШІ.
Тому… звільнення є, але переважно не через ШІ. В ковідні часи понабирали людей з запасом. А коли зрозуміли, що ковід закінчився, і люди не лишаються в онлайні як очікувалось, а повертаються в офлайн — порізали плани по розробці та почали звільняти надлишкових людей. Плюс кризові явища в економіці привели до звільнень.
І навіть з сьогоднішніми цінами, якби все було так просто, майже весь український аутсорс вже б закрився. Але цього немає і близько, навіть не зважаючи на війну і всі пов’язані з нею проблеми. Так, ШІ буде впроваджуватись все більше, але це не буде швидко як очікують оптимісти. І це буде дорожчати, бо компанії колись захочуть повернути свої вкладення.
Отже, можете не погоджуватись, Ваше право. Але я за цим давно спостерігаю, і не бачу поки що кардинальних змін на ринку праці, хоча цим весь час лякають. Так, у вимогах вакансій з’явились рядки із згадуванням AI у різних варіаціях. Але скільки пам’ятаю — регулярно з’являються все нові must-have вимоги для девелоперів. І тут нічого нового. Просто ще один інструмент і ще один хайп. Не здивуюсь, якщо через пару-трійку років почнеться черговий бум, і людей будуть знову відловлювати на будь-яку зарплату (не ТЦК).
Дуже смішно читати про збитковість, коли будуються все нові і нові дата центри. Звісно якщо вкладати гроші у розвиток, то про який прибуток може йти мова. Теж саме було з тесла, коли вони вкладалися у заводи, ходили крикуни і кричали про збитки, яких, не було по факту. Теж саме і зараз. Так, хайп є, але це явно не бульбашка. Бульбашка це коли ти продаєш повітря, а тут потужна (не зеленський :) технологія, яку можна помацати. Залишилося тільки привчити прогерів використовувати ефективно токени, що і відбувається. Багато інфи як правильно використовувати інструмент і як менше палити токени.
І я впевнений що ШІ призведе не до відсутності роботи, а до збільшення. Так само як ткацький верстак призвів до звільнень швей, але врезультаті дав ще більше роботи та професій. Тому звільнення прогерів та інших будуть, але вакансій буде більше, а роботи менше. Я думаю що через ШІ введуть 3−4 робочий тиждень при тих же ЗП.
Тому називати ШІ-компанії бульбашками ось це хайп, просто хтось використав ші-бульбашка і підняв переглядів і продовжує піднімати.
Ще раз, я теж вважаю що за цим майбутнє. Але поки що до прибутковості там ще далеко, хоча вкладені і далі вкладаються гігантські суми, і нас чекають ще гучні банкрутства в цій сфері.
«І я впевнений що ШІ призведе не до відсутності роботи, а до збільшення. Так само як ткацький верстак призвів до звільнень швей, але врезультаті дав ще більше роботи та професій. Тому звільнення прогерів та інших будуть, але вакансій буде більше, а роботи менше.» — а я про що кажу?
«називати ШІ-компанії бульбашками» — я називаю бульбашками не ШІ-компанії, а на ринку формується бульбашка. Коли достатньо згадати в описі продукту AI — і всі біжать масово вкладатись, не розбираючись наскільки прибуткова компанія насправді, і наскільки життєздатний саме цей продукт. Точно так само як було з доткомами. Це давно стало частиною нашого життя. Але в 2000 це все луснуло, і багато хто просто зник з ринку, хоча ще вчора акції цих компаній летіли в небо, а суми інвестиції не поступались сьогоднішній історії з AI (з поправкою на інфляцію за 26+ років)
основні капіталовкладення йдуть у серйозні компанія як антропік чи опенаі. Так є багато всякого лайна довкола, але це відносно невеликий процент, завжди так було, навіть з тими ж ЕМ, багато стартапів закрилось, але вони далі продовжують захоплювати ринок.
«Техніка не вічна»
ніхто там нічого не викидає). В основному просто доставляють, ціни у них оптові, а те що застаріле то ми звами на ура купуємо вони ще у профіті залишаються). Всі хто говорять про бульбашки в основному самі ж і хайпують. А інвестори, це не дотації, це вкладання коштів для отримання вигоди, і це велика різниця. Кожен бізнес що розвивається, вкладає кошти у будівництво, не буде приносити прибутку. Це нормально. Але кричати про збиток, нерентабельність — тупо. Є окремі випадки коли компанії використовували неправильно агенти, тобто змушували працівників витрачати якнайбільше токенів, за це давали бонусу. І це призвело до збитковості тарифу і тому ліміти зжимали. Якщо б цього не було, кількість запитів дозволяє виходити в плюс, що, цілком можливо. Коли користувачі зрозуміють як ефективно користуватися агентами, все стане на свої місця, нова технологія, кожен адаптовується. Тому я не вбачаю ніякої бульбашковості, і навіть якогось хайпу. Те ж саме казали про теслу і що ціна акції висока,хайп. А що тепер? Де ці крикуни.))
«ніхто там нічого не викидає» — це спеціалізована техніка, яка не підходить для домашнього використання. Навіть якщо по частинах, оперативна пам’ять — кому буде потрібний DDR5 (серверні модулі) через 5−6 років? Тим більше в таких об'ємах? Їх якщо викинуть на ринок — його буде як сміття за копійки. А зараз ціни на них — космос, і їх вигрібають по будь-якій ціні для дата-центрів. Ціни загнали в рази, що потягнуло за собою і ціни на смартфони та компьютери/ноутбуки, які через це подорожчали просто неадекватно. HBM-пам'ять не тільки не підходить для домашнього використання, а й випаювати її з плат прискорювачів трохи проблематично :) А SSD вживане після серверів хто купить? Там ресурс сильно обмежений. Спецалізовані плати ШІ-прискрювачів, які коштують найбільше — побутовим споживачам не потрібні. Тому майже нічого вони не повернуть :)
І амортизація якщо не включається в собівартість — це саме дотації, і на даний момент це не рентабельно. Всі вкладаються у майбутнє в надії що з розвитком ринку компанії почнуть отримувати пррибуток і це окупиться. Але окупиться не у всіх.
для багатьох людей зібрати такий комп за щастя). Крім того життя там не 5−6 років, оновлюють частіше. А ще такий момент, коли виходить щось нове, попадає спочатку до таких компаній, потім через пів року купують багаті, ще через рік починає купувати середній клас той що побагатше, потім ще через пів року ті що побідніше, ну і т.д. За таке обладнання можна через 3-4 роки брати 30% ціни легко. І це я маю на увазі не домашні пк, а бізнеса, хостинги, шарінги і так далі.
«OpenAI як раз один з перших кандидатів на виліт»
наприкінці лютого річний темп виручки перевищив $25 млрд, зараз компанія отримує близько $2 млрд виручки на місяць, чатжпт має понад 900 млн активних користувачів на тиждень ага перший на виліт .
«Якщо не вірите мені, то поцікавтесь в ШІ. «
я вже давно поцікавився, просто я вмію аналізувати ситуацію, а не користуватися висерами різних журналюг. Хтось свідомо говорить про одне, а замовчує інше, а ви раді вуха розвісити.
А якщо про бізнеса, то 30% вартості — це звісно добре, але 70% втрати вартості за 3−4 роки це чимала сума. Оосбливо враховуючи що зараз через дефіцит обладнання закуповується по завищених в рази цінах.
«темп виручки перевищив $25 млрд, зараз компанія отримує близько $2 млрд виручки на місяць, чатжпт має понад 900 млн активних користувачів на тиждень» — поцікавтесь, скільки з цих користувачів використовують безкоштовну версію, а скільки платять :)
І скільки сотень мільярдів вже вкладено і ще планується. І де в цій сумі виручка (не прибуток) 25 мільярдів на рік? В 2026-му тільки на очислювальні потужності (оренда дата-центрів) OpenAI планує витратити біля 50 млрд.
ну це все не для домашнього користування, ігри запускати. Там же і ведео і память, різне обладнання, доволі дороге і яке буде котируватись ще роки. Наприкл. покупці списаних шікарт можуть бути домашні ентузіасти ші, невеликі компанії, університети дрібні хостинги і т.д. Писати що от взяв і викинув A100, H100, H200, B200 ну смішно.
«поцікавтесь, скільки з цих користувачів використовують безкоштовну версію, а скільки платять «
так, переважна більшість користувачів безкоштовні. Але з цього ще не випливає, що бізнес-модель нежиттєздатна. І ті безкоштовні вони не вантажать, а платні. Але звідки такі цифри про «скільки сотень мільярдів вже вкладено», може ви путаєте, залучено, законтрактовано і скільки планується вкласти? Тоді так. Але знову ж таки, враховуючи потенціал, те що технологія на стадії зародку, кричати все пропало, ну смішно).
Моя думка що все це виходить далеко за межі прибутку як такого, це про володіння масами. Он як іран роздовбали використовуючи ШІ. Вони три рази вичисляли з допомогою ШІ де будуть всі ті хамені і ко, це зброя. Тому однозначно все це туфта, розганяється невідомо для чого.
Що стосується Ірана, то по-перше це не OpenAI, а по-друге, там переконаний що в першу чергу працювала ізраїльська розвідка, яка всіх відслідковувала. А якщо подивитись, в яку дупу американці влізли з цим вторгненням, то якось не дуже добре спрацював AI, мабуть і тут десь помилився :)
«першу чергу працювала ізраїльська розвідка, яка всіх відслідковувала.»
це не була ізраїльська розвідка, вже відомо як вони це зробили, з допомогою ШІ від антропіка, який передбачав де вони будуть збиратися і наносилися удари.
«А якщо подивитись, в яку дупу американці влізли з цим вторгненням»
дурість трампа не може покрити навіть такий інструмент. Але мова не про результат політичний, а як саме спрацював ШІ як зброя. І швидше за все трамп знав що буде заблокований Ормуз і так як це вигідно пуйлу, він цю операцію і провів.
Тесла… Тесла теж переживала складні часи, і цілком могла зникнути свого часу. Як мінімум двічі, один з них під час кризи 2008-го, а другий раз в 2017—2019. Маск сам потім визнавав що Тесла була за крок до банкрутства. Те, що Тесла вижила на грані і не закрилась — не означає, що така ж доля буде в OpenAI.
«вже відомо як вони це зробили, з допомогою ШІ від антропіка» — оце нам Петагон все розкаже, що і як було :). А я чув іншу історію. Що ізраїльтяни змогли відслідкувати місце збору іранської верхівки, і швидко втягнули США в діло, оскільки це була унікальна можливість. І США не подумавши через брак часу встяли в цю авантюру. А так звісно, це Антропік сам здогадався за допомогою телепатії, куди вони всі пішли/поїхали і де і коли зібрались :)
Антропік використовувався для ударів по воєнних цілях, і то помилявся, коли наприклад ракета попала в школу для дівчат і велика кількість дітей загинула. Імовірно через застарілу інформацію, бо колись будинок належав КВІРу. Що до речі часто з ним буває — застарілі дані призводять до некоректних висновків.
«Що ізраїльтяни змогли відслідкувати місце збору іранської верхівки»…«і швидко втягнули США в діло, оскільки це була унікальна можливість»
самому не смішно від написаного)? Зараз люди практично не задіяні у зборі інформації. Зараз все збирається в цифровому вигляді, з телефонів, камер, супутників і т.д. Масив інформації - космічний. Донедавна було складно обробляти її, але антропік довели свою модель до необхідного рівня. Вона на основі цих даних будує припущення та як краще та ефективніше щось зробити.
«і велика кількість дітей загинула»
там було прикриття дітьми, загинув чи був серйозно поранений хтось з серйозних людей, можливо син Хаменеї. Ну, а про помилку говорять бо на заході це б не сприйняли нормально що знищили когось незважаючи на дітей.