инженерные заметки

Инженерные заметки

Carbonfay Engineering Notes — плотные инженерные разборы: архитектура ИИ-систем, инженерия контекста, экономика и организация. Не SEO-вода, а то, что мы поняли на практике.

заметка 4 мин

Что такое AI-native engineering и почему это не «разработка с ChatGPT»

Что значит AI-native инженерия: runtime-мышление, архитектура вокруг моделей и контроль стоимости — и почему это не генерация кода в чате.

заметка 5 мин

RED-driven development: зрелость ИИ-агента — в красных тестах

Почему для ИИ-агентов цикл «фича → тест → зелено» недостаточен и как RED-driven development измеряет зрелость качеством пережитых красных тестов, а не числом зелёных.

заметка 5 мин

GREEN bias: как среды разработки фальсифицируют качество ИИ-агентов

Почему тестирование ИИ-агентов даёт зелёные отчёты, а агент проваливается в проде: встроенный перекос сред разработки на GREEN и как его обойти честной оценкой.

заметка 5 мин

Бот, который проходит все тесты и не продаёт

Почему ИИ-бот с 95% зелёных тестов почти не влияет на продажи: тесты проверяют знание фактов, а не работу с сомнением, удержание диалога и возврат клиента.

заметка 6 мин

Почему все демо-боты умнее реальных

Демо ИИ-бота всегда умнее прода: тесты пишут люди, знающие систему, и неосознанно помогают агенту. Это класс инженерной ошибки, а не «недокрутили промпт».

заметка 6 мин

Контекстное загрязнение тестов

Если тестирующий — человек или LLM — знает устройство системы, тест испорчен: подсказка протекает в проверку. Решение — полная изоляция тест-контура от знания о реализации.

заметка 7 мин

Интенты не существуют

Почему классическая схема «пользователь → интент → слоты → результат» работает только в презентациях, а живой человек держит несколько намерений сразу и меняет их по ходу диалога.

заметка 7 мин

Хаос как первичная форма человеческого диалога

Почему команды считают хаотичный диалог ошибкой пользователя, а на деле хаос — норма живого разговора, и проектировать диалоговую систему нужно под него, а не «обучать» человека.

заметка 6 мин

Почему пользователь не знает, чего хочет

Диалоговый ИИ-агент исполняет первую реплику как готовую потребность, но чаще потребность формируется внутри диалога. Как проектировать агента, который ведёт к формулировке, а не угадывает.

заметка 6 мин

Ложь пользователя как штатный режим работы

Пользователь регулярно даёт ИИ-агенту неверные данные — бюджет, даты, цель — и не со зла. Зеркало к галлюцинациям LLM: проектирование под недостоверный вход как основа надёжности агента.

заметка 6 мин

Модель когнитивного шума

Качество ИИ-агента определяется не правильным ответом, а устойчивостью к шуму диалога: смене темы, противоречиям, эмоциям, возврату к старым вопросам. Как переопределить метрику качества.

заметка 4 мин

Почему чат-бот — это не ИИ-архитектура

Чем корпоративный чат-бот отличается от ИИ-системы: состояние, контракты, контроль человека — и почему это решает деньги и риск.

заметка 8 мин

Красная команда для диалогового ИИ

AI red team для диалогового ИИ: почему разработчик не может честно проверить своего агента и зачем нужен независимый агент-оппонент, чья задача — именно его сломать.

заметка 7 мин

Агент против агента: новая модель QA

Тестировщик диалогового ИИ — другой агент, а не человек. Архитектура «Симулятор клиента → Целевой агент → Судья» как мультиагентная инженерия, применённая к QA.

заметка 7 мин

Тестирование агента против реальных диалогов

Почему синтетические сценарии бесполезны при тестировании чат-ботов и ИИ-агентов, и как корпус реальных диалогов становится источником истины и активом компании.

заметка 6 мин

Почему LLM плохо играют роль клиента

Симуляторы клиента на LLM ведут себя слишком разумно и помогают агенту вместо того чтобы его ломать. Почему для честного тестирования ИИ-агентов нужны модели трудного поведения.

заметка 4 мин

Почему компаниям нужен не чат-бот, а операционная ИИ-среда

Почему точечный чат-бот не масштабируется, а операционная ИИ-среда снижает координационные издержки и даёт руководителю видимость процессов.

заметка 4 мин

Контекст как главный ресурс ИИ-системы

Почему качество ИИ-системы определяется управлением контекстом, а не размером модели, и как этим управлять инженерно.

заметка 4 мин

Энтропия контекста и деградация качества ответов

Как накопление шума в контексте снижает качество ответов ИИ-системы и какие инженерные приёмы это сдерживают.

заметка 4 мин

Почему естественный язык неудобен для машинной координации

Где естественный язык создаёт издержки и ошибки в обмене между агентами и как компактные представления смысла это решают.

заметка 4 мин

Нужны ли машинам отдельные языки для координации

Зачем агентам компактные машинные представления смысла вместо естественного языка и что это меняет в стоимости и надёжности.

заметка 5 мин

Архитектура RAG-системы: источники, индексация, переранжирование

Как устроена RAG-система (retrieval augmented generation): источники, индексация, гибридный поиск, переранжирование и подача минимально достаточного контекста.

заметка 6 мин

Как создать RAG-систему, которая не врёт в проде

Практический разбор создания RAG-системы: источники, индексация по событиям, гибридный поиск с переранжированием и оценка достоверности ответов.

заметка 4 мин

RAG: где помогает, а где создаёт иллюзию знания

Когда RAG реально повышает точность, а когда лишь уверенно ошибается, и как отличить понимание бизнеса от поиска по базе.

заметка 4 мин

Локальная RAG-система: когда она оправдана, а когда нет

Когда локальная RAG-система реально нужна: безопасность данных, контур, стоимость владения — и когда облако выгоднее.

заметка 4 мин

Архитектура мультиагентных систем: роли, контракты, координация

Из чего состоит мультиагентная система: агент как элемент, контракты вход/выход, координация и обмен сообщениями между агентами.

заметка 7 мин

Разработка мультиагентных систем: архитектура, которая не разваливается

Как проектировать мультиагентные системы, которые работают в проде: роли, контракты, координация, отказоустойчивость и предсказуемая стоимость.

заметка 4 мин

Проблемы мультиагентных систем и как их избегать

Разбор типовых отказов мультиагентных систем — зацикливание, дрейф контекста, рост стоимости — и инженерные способы их избежать.

заметка 4 мин

Оркестрация ИИ-агентов в бизнес-процессах

Что такое оркестрация ИИ-агентов: как связать агентов, инструменты и людей в управляемый бизнес-процесс с контролем стоимости.

заметка 4 мин

Событийные ИИ-системы вместо простых сценариев

Почему линейный сценарий ломается на исключениях, а событийная архитектура делает ИИ-систему устойчивой и наблюдаемой.

заметка 4 мин

Снижение координационных издержек через ИИ

Почему основная скрытая стоимость крупной компании — координация, и как ИИ-слой её снижает без сокращения людей.

заметка 6 мин

Мультиагентные системы в мире: путеводитель по переводным статьям

60 переводных статей о мультиагентных системах, сгруппированных по темам: введение, архитектуры, платформы и фреймворки, обучение, применение, инженерия в проде, обзоры и дайджесты.

заметка 4 мин

Автоматизация бизнес-процессов с помощью ИИ: что реально работает

Какие бизнес-процессы реально автоматизируются ИИ — классификация, маршрутизация, черновики, сведение статусов — и где это не окупается.

заметка 4 мин

Как ИИ сжимает операционные процессы

Как ИИ убирает промежуточные шаги, согласования и ожидания в операционных процессах и что это даёт по времени цикла.

заметка 4 мин

Cost-aware архитектура ИИ-систем

Как проектировать ИИ-системы, где стоимость — инженерная метрика наравне с задержкой и надёжностью, а не сюрприз в конце месяца.

заметка 4 мин

Почему ИИ-автоматизация может внезапно стать дорогой

Откуда берётся неконтролируемый рост стоимости ИИ-автоматизации: длина контекста, ретраи, неудачная маршрутизация — и как держать бюджет.

заметка 4 мин

Как считать окупаемость ИИ-агентов

Модель расчёта окупаемости ИИ-агентов: что считать выгодой, как учитывать стоимость токенов и эксплуатации, какие допущения опасны.

заметка 5 мин

Сколько стоит разработка ИИ-агентов и от чего зависит цена

Из чего складывается стоимость разработки ИИ-агентов: процесс, интеграции, контроль человека, эксплуатация и стоимость токенов.

заметка 4 мин

Лучшие подходы к ИИ-агентам для бизнеса: чем мерить «лучший»

Чем измерять „лучший“ ИИ-агент для бизнеса: надёжность, стоимость владения, контроль человека и встраиваемость в процессы — а не модель.

заметка 4 мин

Скрытый хардкод в ИИ-автоматизации

Как зашитые правила и промпт-цепочки превращают ИИ-автоматизацию в технический долг и почему это бьёт по стоимости изменений.

заметка 5 мин

Внедрение ИИ в компанию: с чего начать и сколько стоит

Внедрение ИИ окупается на конкретных повторяющихся процессах: с чего начать, как считать стоимость и эффект, чего не делать.