Перейти к содержимому
Carbonfay
EN

Документы и данные

ИИ-агент извлечения данных из счетов

ИИ-агент для счетов и накладных: извлекает позиции, суммы и реквизиты, сверяет контрагента с ФНС и заказом, проводит в учёт. Спорное — в ручную очередь.

«У нас сотни входящих счетов в месяц, давайте их распознавать» — частый запрос. Но «загрузить картинку в модель и забрать сумму» — это прототип, а не учётный процесс: счёт уходит в проводку, ошибка стоит денег и сверки с поставщиком. Агент извлечения данных из счетов строится как управляемая цепочка: распознавание, извлечение реквизитов и позиций, сверка с ФНС и заказом — и ручная очередь там, где автомату доверять нельзя.

Что он делает

Получает счёт или накладную из канала (почта, портал поставщика, скан), распознаёт текст и таблицу позиций, извлекает реквизиты и построчные данные под конкретный тип документа. Сверяет контрагента с реестром ФНС, проверяет сходимость сумм и соответствие позиций заказу. Чистые документы с высокой уверенностью проводятся в учёт автоматически; спорные — с расхождением сумм, незнакомым ИНН, мутным сканом — уходят оператору с уже подсвеченным проблемным полем. Каждый слой проверяемый и заменяемый, в отличие от чёрного ящика «загрузил и провёл».

Где проходит граница

Любая автоматическая обработка счетов даёт ошибки; вопрос в том, видны ли они до проводки. Поэтому контроль человека — не опция, а часть контракта: пороги уверенности на каждом поле, очередь ручной сверки, трассировка от итоговой суммы до конкретной строки распознанной таблицы. Подробнее об инженерии — на странице обработки документов с ИИ; распознавание разнородных бланков опирается на векторный поиск там, где нужен смысл позиции, а не шаблон под одного поставщика.

Как устроена цепочка

  1. 01
    Распознавание скана · OCR-движок

    Превращает фото или PDF счёта в текст с координатами и таблицей позиций. На чистых типовых бланках этого слоя уже достаточно.

  2. 02
    Извлечение реквизитов и позиций · средняя модель

    Достаёт ИНН, КПП, номер и дату, сумму с НДС и построчные позиции по смыслу, а не по жёсткому шаблону под одного поставщика.

  3. 03
    Сверка с ФНС и заказом · детерминированный код

    Проверяет контрагента в реестре ФНС, сходимость сумм по строкам и итогу, соответствие позиций заказу. Несовпадения — в ручную очередь.

Интеграции

OpenAI GigaChat Google Sheets DaData

+ любой внешний API

Калькулятор стоимости

200
3
Токены, ₽/мес
Разработка, ₽
Поддержка, ₽/мес

Оценка по усреднённой ставке за токен (вход+выход). Точная стоимость зависит от длины контекста, числа вызовов и доли ручного контроля — посчитаем по вашему процессу.

связанные кейсы

частые вопросы

Вопросы по делу

OCR или LLM — что извлекает данные из счёта?
Связка, и порядок важен. OCR превращает скан в текст с разметкой таблиц, модель достаёт реквизиты и позиции по смыслу, детерминированная сверка ловит ошибки. На чистых типовых бланках одного поставщика хватает OCR с правилами без модели — это дешевле и предсказуемее, чем гонять каждый счёт через LLM.
Как агент сверяет контрагента и не пропускает левый счёт?
Извлечённый ИНН проверяется в реестре ФНС: существует ли юрлицо, не ликвидировано ли, совпадают ли название и КПП. Параллельно сходятся суммы по строкам с итогом и позиции — с тем, что реально заказывали. Любое несовпадение помечается и уходит на ручную проверку, а не в проводку.
Как ошибки извлечения не попадают в учётную систему?
Через явные пороги уверенности. Всё ниже порога — в ручную очередь оператору, всё выше — в учётную систему через тот же контракт, что и у людей. По каждому счёту видно, какое поле из какой строки извлечено и как прошло сверку: трассировка, а не «модель так решила».
Где это даёт эффект?
Входящие счета и накладные в бухгалтерии, сверка с заказами в закупках, первичка по поставщикам. Эффект меряется по скорости обработки одного документа и доле счетов, прошедших до проводки без участия человека, — до внедрения и после.

Следующий шаг

Спроектируем слой автоматизации на ИИ под ваши процессы.

DBCV