инженерные заметки
Инженерные заметки
Carbonfay Engineering Notes — плотные инженерные разборы: архитектура ИИ-систем, инженерия контекста, экономика и организация. Не SEO-вода, а то, что мы поняли на практике.
Что такое AI-native engineering и почему это не «разработка с ChatGPT»
Что значит AI-native инженерия: runtime-мышление, архитектура вокруг моделей и контроль стоимости — и почему это не генерация кода в чате.
RED-driven development: зрелость ИИ-агента — в красных тестах
Почему для ИИ-агентов цикл «фича → тест → зелено» недостаточен и как RED-driven development измеряет зрелость качеством пережитых красных тестов, а не числом зелёных.
GREEN bias: как среды разработки фальсифицируют качество ИИ-агентов
Почему тестирование ИИ-агентов даёт зелёные отчёты, а агент проваливается в проде: встроенный перекос сред разработки на GREEN и как его обойти честной оценкой.
Бот, который проходит все тесты и не продаёт
Почему ИИ-бот с 95% зелёных тестов почти не влияет на продажи: тесты проверяют знание фактов, а не работу с сомнением, удержание диалога и возврат клиента.
Почему все демо-боты умнее реальных
Демо ИИ-бота всегда умнее прода: тесты пишут люди, знающие систему, и неосознанно помогают агенту. Это класс инженерной ошибки, а не «недокрутили промпт».
Контекстное загрязнение тестов
Если тестирующий — человек или LLM — знает устройство системы, тест испорчен: подсказка протекает в проверку. Решение — полная изоляция тест-контура от знания о реализации.
Интенты не существуют
Почему классическая схема «пользователь → интент → слоты → результат» работает только в презентациях, а живой человек держит несколько намерений сразу и меняет их по ходу диалога.
Хаос как первичная форма человеческого диалога
Почему команды считают хаотичный диалог ошибкой пользователя, а на деле хаос — норма живого разговора, и проектировать диалоговую систему нужно под него, а не «обучать» человека.
Почему пользователь не знает, чего хочет
Диалоговый ИИ-агент исполняет первую реплику как готовую потребность, но чаще потребность формируется внутри диалога. Как проектировать агента, который ведёт к формулировке, а не угадывает.
Ложь пользователя как штатный режим работы
Пользователь регулярно даёт ИИ-агенту неверные данные — бюджет, даты, цель — и не со зла. Зеркало к галлюцинациям LLM: проектирование под недостоверный вход как основа надёжности агента.
Модель когнитивного шума
Качество ИИ-агента определяется не правильным ответом, а устойчивостью к шуму диалога: смене темы, противоречиям, эмоциям, возврату к старым вопросам. Как переопределить метрику качества.
Почему чат-бот — это не ИИ-архитектура
Чем корпоративный чат-бот отличается от ИИ-системы: состояние, контракты, контроль человека — и почему это решает деньги и риск.
Красная команда для диалогового ИИ
AI red team для диалогового ИИ: почему разработчик не может честно проверить своего агента и зачем нужен независимый агент-оппонент, чья задача — именно его сломать.
Агент против агента: новая модель QA
Тестировщик диалогового ИИ — другой агент, а не человек. Архитектура «Симулятор клиента → Целевой агент → Судья» как мультиагентная инженерия, применённая к QA.
Тестирование агента против реальных диалогов
Почему синтетические сценарии бесполезны при тестировании чат-ботов и ИИ-агентов, и как корпус реальных диалогов становится источником истины и активом компании.
Почему LLM плохо играют роль клиента
Симуляторы клиента на LLM ведут себя слишком разумно и помогают агенту вместо того чтобы его ломать. Почему для честного тестирования ИИ-агентов нужны модели трудного поведения.
Почему компаниям нужен не чат-бот, а операционная ИИ-среда
Почему точечный чат-бот не масштабируется, а операционная ИИ-среда снижает координационные издержки и даёт руководителю видимость процессов.
Контекст как главный ресурс ИИ-системы
Почему качество ИИ-системы определяется управлением контекстом, а не размером модели, и как этим управлять инженерно.
Энтропия контекста и деградация качества ответов
Как накопление шума в контексте снижает качество ответов ИИ-системы и какие инженерные приёмы это сдерживают.
Почему естественный язык неудобен для машинной координации
Где естественный язык создаёт издержки и ошибки в обмене между агентами и как компактные представления смысла это решают.
Нужны ли машинам отдельные языки для координации
Зачем агентам компактные машинные представления смысла вместо естественного языка и что это меняет в стоимости и надёжности.
Архитектура RAG-системы: источники, индексация, переранжирование
Как устроена RAG-система (retrieval augmented generation): источники, индексация, гибридный поиск, переранжирование и подача минимально достаточного контекста.
Как создать RAG-систему, которая не врёт в проде
Практический разбор создания RAG-системы: источники, индексация по событиям, гибридный поиск с переранжированием и оценка достоверности ответов.
RAG: где помогает, а где создаёт иллюзию знания
Когда RAG реально повышает точность, а когда лишь уверенно ошибается, и как отличить понимание бизнеса от поиска по базе.
Локальная RAG-система: когда она оправдана, а когда нет
Когда локальная RAG-система реально нужна: безопасность данных, контур, стоимость владения — и когда облако выгоднее.
Архитектура мультиагентных систем: роли, контракты, координация
Из чего состоит мультиагентная система: агент как элемент, контракты вход/выход, координация и обмен сообщениями между агентами.
Разработка мультиагентных систем: архитектура, которая не разваливается
Как проектировать мультиагентные системы, которые работают в проде: роли, контракты, координация, отказоустойчивость и предсказуемая стоимость.
Проблемы мультиагентных систем и как их избегать
Разбор типовых отказов мультиагентных систем — зацикливание, дрейф контекста, рост стоимости — и инженерные способы их избежать.
Оркестрация ИИ-агентов в бизнес-процессах
Что такое оркестрация ИИ-агентов: как связать агентов, инструменты и людей в управляемый бизнес-процесс с контролем стоимости.
Событийные ИИ-системы вместо простых сценариев
Почему линейный сценарий ломается на исключениях, а событийная архитектура делает ИИ-систему устойчивой и наблюдаемой.
Снижение координационных издержек через ИИ
Почему основная скрытая стоимость крупной компании — координация, и как ИИ-слой её снижает без сокращения людей.
Мультиагентные системы в мире: путеводитель по переводным статьям
60 переводных статей о мультиагентных системах, сгруппированных по темам: введение, архитектуры, платформы и фреймворки, обучение, применение, инженерия в проде, обзоры и дайджесты.
Автоматизация бизнес-процессов с помощью ИИ: что реально работает
Какие бизнес-процессы реально автоматизируются ИИ — классификация, маршрутизация, черновики, сведение статусов — и где это не окупается.
Как ИИ сжимает операционные процессы
Как ИИ убирает промежуточные шаги, согласования и ожидания в операционных процессах и что это даёт по времени цикла.
Cost-aware архитектура ИИ-систем
Как проектировать ИИ-системы, где стоимость — инженерная метрика наравне с задержкой и надёжностью, а не сюрприз в конце месяца.
Почему ИИ-автоматизация может внезапно стать дорогой
Откуда берётся неконтролируемый рост стоимости ИИ-автоматизации: длина контекста, ретраи, неудачная маршрутизация — и как держать бюджет.
Как считать окупаемость ИИ-агентов
Модель расчёта окупаемости ИИ-агентов: что считать выгодой, как учитывать стоимость токенов и эксплуатации, какие допущения опасны.
Сколько стоит разработка ИИ-агентов и от чего зависит цена
Из чего складывается стоимость разработки ИИ-агентов: процесс, интеграции, контроль человека, эксплуатация и стоимость токенов.
Лучшие подходы к ИИ-агентам для бизнеса: чем мерить «лучший»
Чем измерять „лучший“ ИИ-агент для бизнеса: надёжность, стоимость владения, контроль человека и встраиваемость в процессы — а не модель.