инженерные заметки
Как считать окупаемость ИИ-агентов
Модель расчёта окупаемости ИИ-агентов: что считать выгодой, как учитывать стоимость токенов и эксплуатации, какие допущения опасны.
Коротко для руководителя. Окупаемость ИИ-агента считается по конкретному процессу, а не «по внедрению ИИ». Честный расчёт учитывает не только сэкономленные часы, но и стоимость токенов и эксплуатации — иначе цифра получается красивой и ложной. Ожидаемый ROI в опросах кратно выше реализованного именно потому, что считают выгоду и забывают про затраты владения. Ниже — модель, которая считает обе стороны.
«Когда это окупится?» — правильный вопрос, на который чаще всего отвечают неправильно: берут сэкономленные ставки и делят на стоимость разработки. В этой формуле нет половины затрат, поэтому она всегда оптимистична.
Окупаемость считают по процессу — и по полной стоимости владения.
Гипотеза: окупаемость считается по процессу, а не по «внедрению»
ИИ-агент не окупается «вообще». Окупается автоматизация конкретной операции с измеримым выходом. Поэтому единица расчёта — процесс: сколько он стоил до и сколько стал стоить после, с учётом всех затрат, а не только разработки.
Ожидания кратно выше реализованного эффекта. Окупаемость считают честно — по конкретному процессу и полной стоимости владения, а не по ожиданию в 171%.
Разрыв между ожидаемым (171%) и реально реализованным (значимый ROI — у менее 1%) — это и есть цена неполного расчёта.
Проблема: считают выгоду, забывают затраты владения
Типичная модель: (сэкономленные часы × ставка) ÷ стоимость разработки. В ней нет: стоимости токенов на каждом обращении, эксплуатации и мониторинга, поддержки при изменении процесса, доли случаев, всё равно требующих человека. Каждый из этих пунктов в проде существенен, и без них окупаемость завышена кратно.
Почему обычные подходы не работают
«Посчитаем по сэкономленным ставкам» не работает: экономия — только одна сторона; ИИ-агент, в отличие от обычного софта, стоит денег на каждом обращении.
«Возьмём ожидаемый ROI из опросов» не работает: ожидания систематически кратно выше реализованного, это видно по данным.
«Окупаемость посчитаем после пилота» не работает как обоснование бюджета: без модели затрат пилот покажет эффект, но не стоимость владения в масштабе.
Инженерная модель: как считать честно
Выгода — по процессу. Снятая повторяющаяся работа, сокращённое время цикла, уменьшение согласований — в деньгах и в конкретной операции, а не «по компании».
Затраты — полные. Разработка + эксплуатация + токены при вашем объёме
- поддержка при изменении процесса + остаточная доля человека. Токен- стоимость берётся не из прототипа (где обращений десятки), а из проекции на реальный объём.
Чувствительность к объёму. Стоимость токенов растёт с числом обращений; выгода — тоже. Считается не точка, а кривая: где процесс выходит в плюс и при каком объёме.
Срок и риск. Окупаемость — это срок (за сколько процесс выходит в плюс) и допущения, при которых он держится. Расчёт без явных допущений бесполезен.
Что не считать выгодой. «Внедрили ИИ», «стали современнее», «сотрудники довольны» — не деньги. В расчёт идёт только измеримое.
Практический вывод для бизнеса
Требуйте расчёт в двух кривых: выгода по объёму и затраты владения по объёму. Точка пересечения — это и есть окупаемость; одно число без второй кривой — это маркетинг.
По данным IDC, из 33 запущенных пилотов до промышленной эксплуатации доходят около 4. Причина провала — не технология, а недооценённая сложность доведения до процесса.
Большинство пилотов не доходят до прода — поэтому окупаемость считают на процессе, который реально пойдёт в эксплуатацию, а не на демонстрации.
Не принимайте ожидаемый ROI за план. Планируйте по консервативной кривой затрат владения; ожидание в 100%+ — это аппетит рынка, а не прогноз.
Приложить это к вашим процессам — .
Открытые вопросы
Как оценивать в деньгах качество решений (не только их стоимость) — задача без общего стандарта. Фиксированная цена или оплата по факту для ИИ-систем — открытый вопрос: процесс уточняется по ходу. Как считать выгоду, когда она — снятая координация, — модель по времени цикла, а не отраслевая норма.
Назовите процесс и ваш объём обращений — и окупаемость можно посчитать двумя кривыми до старта. — соберём выгоду и полную стоимость владения на вашем процессе.