Перейти к содержимому
Carbonfay
EN

Знания и поиск

RAG-агент по корпоративной базе знаний

RAG-агент отвечает на вопросы сотрудников и клиентов по вашим документам и регламентам — с опорой на источник и ссылкой на него. Нет в базе — честно говорит, что нет.

RAG-системы

«Сотрудники по сто раз спрашивают одно и то же, давайте посадим ИИ на нашу базу знаний» — понятный запрос. Но «дать модели документы и спросить» порождает уверенные выдумки: модель достроит ответ, которого в регламенте нет, и сделает это убедительно. RAG-агент строится иначе: сначала поиск по вашей базе, ответ строго из найденного со ссылкой на источник, и честное «не нашёл» там, где источников нет.

Что он делает

Принимает вопрос сотрудника или клиента в любом канале, ищет релевантные фрагменты в векторном индексе ваших документов, регламентов и истории обращений и формирует ответ строго из найденного. К каждому ответу прикладывает ссылку на документ и раздел, чтобы человек видел первоисточник. Если релевантного в базе нет — отвечает «в источниках не нашёл» и при необходимости передаёт человеку. Это не чат «по мотивам» корпоративных знаний, а аудируемый ответ с трассировкой до конкретного документа.

Где проходит граница

Главный риск RAG — не «не нашёл ответ», а уверенно выданная выдумка, которую невозможно отличить от факта. Поэтому отказ — часть контракта агента: порог релевантности, явное «в базе нет», ссылка на источник под каждым ответом. Поиск по знаниям внутри агента — это полноценная RAG-система, а его качество напрямую зависит от того, как собрана векторная база знаний: без чистого индекса даже идеальная модель будет отвечать по мусору.

Как устроена цепочка

  1. 01
    Поиск по базе знаний · эмбеддер

    По вопросу находит релевантные фрагменты в векторном индексе документов, регламентов и истории — по смыслу, а не по совпадению слов.

  2. 02
    Ответ с опорой на источник · RAG + средняя модель

    Формирует ответ строго из найденных фрагментов и прикладывает ссылку на документ и раздел. Опора — на источник, а не на память модели.

  3. 03
    Контроль покрытия · правило + модель

    Если релевантных фрагментов нет или они слабые — отвечает «в базе не нашёл», а не выдумывает. Граница вместо галлюцинации.

Интеграции

OpenAI YandexGPT Google Sheets Telegram

+ любой внешний API

Калькулятор стоимости

200
3
Токены, ₽/мес
Разработка, ₽
Поддержка, ₽/мес

Оценка по усреднённой ставке за токен (вход+выход). Точная стоимость зависит от длины контекста, числа вызовов и доли ручного контроля — посчитаем по вашему процессу.

связанные кейсы

частые вопросы

Вопросы по делу

Чем RAG-агент отличается от ChatGPT по нашим документам?
ChatGPT отвечает из памяти модели и звучит уверенно даже когда выдумывает. RAG-агент сначала ищет фрагменты в вашей базе, отвечает строго из найденного и прикладывает ссылку на источник. Если в документах ответа нет — он это говорит, а не дополняет правдоподобной выдумкой. Для регламентов и клиентских ответов это принципиально.
Что делает агент, если ответа нет в базе?
Честно отвечает, что в источниках не нашёл, и при необходимости передаёт вопрос человеку. Это сознательная граница, а не недоработка: лучше «не знаю», чем уверенный неверный ответ по регламенту или договору. Порог релевантности настраивается под цену ошибки в конкретном процессе.
Можно ли проверить, откуда агент взял ответ?
Да, в этом смысл. К каждому ответу прикладываются фрагменты-источники со ссылкой на документ и раздел — сотрудник или клиент видит, на чём основан ответ, и может открыть первоисточник. Это снимает спор «агент так сказал» и делает ответы аудируемыми.
Как агент остаётся актуальным при изменении документов?
Он отвечает не по «вшитым» знаниям, а по живому индексу. Обновился регламент — переиндексируется документ, и агент сразу отвечает по новой версии. Построение и обновление этого индекса — отдельная задача векторной базы знаний, на которую агент опирается.

Следующий шаг

Спроектируем слой автоматизации на ИИ под ваши процессы.

DBCV