КОД</>БЕЗ МЕЖ
← Усі статті

Що таке multi-agent система і коли одного агента вже мало

Для 80% бізнесів одного AI-агента достатньо. Для решти 20% — один агент перетворюється на промпт на 2 000 рядків, що ламається щопʼятниці і який ніхто не може дебагнути. Тоді потрібна multi-agent система. Розкладаю, що це таке насправді, коли ви переходите межу, і який стек брати.

Визначення: що таке multi-agent система

Multi-agent система — це двоє і більше LLM-агентів, що передають один одному роботу для виконання задачі, з якою жоден агент сам не справляється. Конкретно:

Це як організація: менеджер (orchestrator) вирішує, що робиться, а спеціалісти (аналітик, sales, support) роблять сфокусовану роботу.

Коли одного агента достатньо

Чесні сигнали, що НЕ треба будувати multi-agent:

90% моїх клієнтів спочатку запускають single-agent версію, навіть коли в кінці кінців потрібен multi-agent. Швидше, дешевше, доводить бізнес-кейс.

Коли реально потрібна multi-agent

Пʼять сигналів, що одного агента вже мало:

  1. Кількість інструментів перетнула 15-20. Один агент з 30 інструментами обирає не той у ~25% випадків. Розбиття на спеціалістів по 5-8 інструментів повертає це до 5%.
  2. Потрібна паралельна робота. «Поки research-агент збирає дані по конкурентах, writer пише вступ». Один агент робить це послідовно — multi-agent водночас.
  3. Різним агентам потрібні різні моделі. Reasoning на Claude Opus, швидкий tool use на GPT-5 Mini, чутливі дані на self-hosted Hermes. Один процес оркеструє всі три.
  4. Домени надто різні. Sales-агенту треба теплий closer-тон. Compliance-агенту — строгий, консервативний. Змішати в один промпт — жоден не працює.
  5. Довготривалі workflows. «Моніторити inbox, драфтити відповідь, отримати approval людини, надіслати». Години або дні. Multi-agent з state persistence — природний фіт.

Реальний приклад: B2B sales pipeline

$23 500 / 10 тижнів для SaaS-клієнта з Варшави. Система:

Результат: MQL→SQL conversion 3× вище, +$340 000 виручки за квартал. Як одного агента я б це не зрелізив — лише qualifier-промпт — це 900 токенів ICP-специфічних правил.

Реальний приклад: research-бот

Внутрішній інструмент для консалтингової фірми. Вхід: «дай summary європейського ринку X за останні 6 місяців». Вихід: 4-сторінкове briefing з джерелами.

Single-agent версія такого існує — 25 хвилин на briefing, пропускає 30-40% джерел. Multi-agent: 4 хвилини, майже повне покриття. Пʼять агентів, один orchestrator, один Postgres для shared state.

Реальний приклад: operations-дашборд

Multi-agent звітний пайплайн для берлінського fintech-у. Щоранку о 8:00:

Результат: −40 годин роботи аналітика на тиждень, аномалії ловляться на 4 дні раніше в середньому. Окупність 2.5 місяці на $36 800 білда.

Стек: як я це реально будую

Шар оркестрації

Memory layer

Model layer

Майже завжди гетерогенний. Orchestrator на Claude Sonnet 4.5, latency-critical спеціалісти на GPT-5 Mini, compliance-спеціаліст на self-hosted Hermes. Див. матрицю вибору моделі →

Observability layer

Реальна ціна

Підводні камені, що я набив

  1. Не дозволяйте агентам спілкуватися напряму між собою.Завжди через orchestrator. Вільний chat між агентами призводить до нескінченних циклів і руйнівних token-білів.
  2. У спеціалістів — вузькі списки інструментів. Кожному агенту лише потрібні йому інструменти. Розшарювання інструментів вбиває приріст точності.
  3. State має бути явним. Імпліцитне «агенти самі розберуться» ніколи не працює. Опишіть payload кожного handoff-а.
  4. Eval кожного агента окремо. Потім eval усієї системи. Два pass rate: per-agent і end-to-end.
  5. Починайте з 2 агентів, не 6. У більшості multi-agent систем, що я бачив у дикій природі, на 3-4 агенти більше, ніж треба. Кожен агент додає латентність і нову точку відмови.

Чи будувати multi-agent?

Чесний тест: якщо один агент з промптом на 1 500 токенів не виконує вашу задачу — може, треба multi-agent. Якщо ще не пробували — спочатку single-agent і поміряйте, де він провалюється.

Я зрелізив і те, і те. Я швидко рекомендую простіший варіант. Букайте дзвінок, за 30 хвилин скажу, з якого боку межі ви.

Написати @tribeofdanel →