Что я называю агентом
Программа, которая принимает задачу высокого уровня (например, «обогати лида данными из открытых источников») и сама решает: какие шаги выполнить, какие инструменты вызвать, в каком порядке. В отличие от workflow с заранее прописанной логикой.
Что работает у меня
Триаж входящих обращений. Агент читает сообщение, классифицирует, при необходимости делает поиск по базе («у нас уже есть этот клиент?»), формирует brief для менеджера. Это устойчиво работает в продакшене.
Обогащение лидов. Поиск по открытым источникам (сайт компании, соцсети, отзывы), извлечение релевантной информации, запись в карточку CRM. Тут агенту нужно решить какие источники проверить — это reasoning, который сложно написать руками.
Аудит документов. Загружаем пакет договоров, агент читает каждый, выявляет нестыковки (даты, суммы, реквизиты), формирует отчёт. Раньше — день работы юриста, теперь — 5 минут.
Что не работает
Финансовые операции. Любой шаг, который списывает деньги или меняет статус платежа — только под человеческим контролем. Не потому что AI ошибётся, а потому что цена ошибки превышает экономию от автоматизации.
Сложные multi-step workflows с десятками условных переходов. Здесь обычная state machine надёжнее. Агент будет каждый раз заново думать «какой следующий шаг» — и иногда ошибаться там, где правило простое.
Real-time с жёстким SLA. Латентность LLM не предсказуема — может быть 2 секунды, а может 30. Для UI-задач, где пользователь ждёт ответа, я ставлю timeout 3 секунды и fallback на детерминированный код.
Архитектура моего агента
Claude API с tool use. Свой orchestrator на Python — не LangChain, потому что LangChain слишком магичный и плохо отлаживается. У меня каждый шаг агента пишется в journal-таблицу в БД: что подумал, что сделал, что получил.
Это позволяет: a) аудитировать решения постфактум, b) откатить состояние при ошибке, c) обучать промпт на реальных примерах через few-shot.
Human-in-the-loop
В production я никогда не убираю человека из цикла полностью. Минимум — финальное подтверждение перед действием. На typology, которая работает безошибочно >95% — можно перейти в auto-mode с уведомлением вместо подтверждения.
Полностью автономный режим — только на необратимых-обратимых операциях. Если шаг можно «откатить одной командой» — можно довериться AI. Если нельзя — нельзя.