услуга
Обработка документов с помощью ИИ
ИИ для обработки документов: извлечение полей, классификация и сверка как шаг управляемого процесса с контролем человека на спорных случаях, а не отдельный «волшебный» продукт.
Обработка документов с помощью ИИ — частая первая точка автоматизации: «у нас тонна счетов и заявок, давайте их распознавать». Но «загрузить картинку в модель и забрать поля» — рабочий прототип и плохая прод-система. Мы строим обработку документов как шаг управляемого процесса: распознавание, извлечение, сверка по правилам и контроль человека там, где результат сомнителен.
Что значит «ИИ-обработка документов»
Это связка из нескольких слоёв, а не одна модель: получение файла из канала (почта, портал, мессенджер, сканер), распознавание текста и таблиц, извлечение полей под конкретный тип документа, классификация (это счёт или акт?), сверка с эталонами и учётными системами, передача спорных случаев человеку. Каждый из этих слоёв проверяемый и заменяемый — в отличие от чёрного ящика «загрузил и получил».
OCR и LLM — честная граница
OCR превращает изображение в текст: знаки, координаты, таблицы. На чистых однотипных формах хорошего качества — этого достаточно: добавил правила извлечения полей и закрыл задачу без LLM. Это дёшево, предсказуемо и быстро.
LLM-извлечение нужно, когда документы разнородные: разные шаблоны счетов, свободный текст в письмах, нетиповые формулировки в договорах. Модель опирается на распознанный текст и достаёт поля по описанию, а не по координатам. Цена — выше, ошибки тоньше, нужны пороги уверенности.
В проде живёт связка: OCR делает «грубую» работу с текстом, LLM — «тонкую» с пониманием, детерминированная сверка ловит то, чему верить нельзя. Пытаться обойтись только одним слоем — частая причина, почему «у нас распознавание работает, а в учёте всё равно ошибки».
Извлечение, классификация, сверка
Извлечение полей — даты, суммы, ИНН, номера, контрагент, позиции в таблице. По каждому полю — модель уверенности; ниже порога — в ручную очередь.
Классификация — тип документа, статус, маршрут. Это шаг, после которого решается, куда документ идёт дальше и какая логика применяется.
Сверка — кросс-проверка по правилам и учётным системам: совпадает ли сумма по позициям с итогом, существует ли контрагент в справочнике, валиден ли номер договора. Сверка — это то, что отличает «распознали» от «можно проводить».
Контроль человека — не «опциональная фича»
Любая ИИ-обработка документов даёт ошибки; вопрос только в том, видны ли они до того, как ушли в учёт. Поэтому мы делаем явные пороги уверенности: всё ниже — в очередь ручного подтверждения, всё выше — автоматом через тот же контракт, по которому работают сотрудники. На каждом документе видно, какое поле извлечено как и из какой строки — это даёт честную трассировку и снимает страх «а вдруг ИИ что-то пропустил».
Где это даёт реальный эффект
Бухгалтерия (счета, акты, накладные, банковские выписки), кадровый учёт (заявления, уставные), страховые и медицинские формы, заявки и обращения с приложениями, скан-копии договоров. Эффект считается по двум осям: скорость обработки документа и доля документов, прошедших без участия человека. Обе цифры меряются до и после — без этого «внедрили ИИ» превращается в маркетинг, а не в результат.
Почему так, а не «коробочный распознаватель»
Коробочный сервис умеет распознавать типовые формы, но не знает ваших правил сверки, маршрутов и интеграций с учётными системами. Мы строим обработку документов как шаг операционного агента с явными контрактами, наблюдаемостью и контролем человека. Подробнее — внедрение ИИ в компанию, автоматизация бизнес-процессов и инженерные кейсы.