КОД</>БЕЗ МЕЖ
← Усі статті

Як обрати між OpenAI, Claude та Hermes для AI-агента

Будь-який AI-проєкт у мене починається з тієї самої розвилки: яку модель поставити в reasoning-шар? OpenAI, Anthropic чи одну з відкритих, типу Hermes? Універсального переможця немає — кожна модель найкраща в чомусь конкретному. Розкладаю матрицю, якою я реально користуюсь, коли вибираю.

Версія на 60 секунд

Раунд 1: довгий контекст

Скільки можна напхати в один промпт без втрати уваги.

Правило: вище ~200К токенів активного reasoning — тільки Claude без retrieval-шару. Нижче — всі три життєздатні.

Раунд 2: tool use і function calling

Тут агент живе або помирає. Модель має вирішити, яку функцію викликати, коли, з якими аргументами, і як реагувати на результат.

Раунд 3: латентність

Час до першого токена і throughput.

Раунд 4: ціна

Реальні цифри з production — input + output разом за середній ход агента.

Раунд 5: EU/UA-комплаєнс і data residency

Для українських і EU-клієнтів у fintech, healthcare і держсекторі — цей раунд часто вирішальний.

Матриця рішень, якою я користуюсь

Коли клієнт каже...

Що я більше НЕ рекомендую

Чого б я НЕ змішував в одному стеку

Спокуса-пастка: «давайте Claude для reasoning і GPT-5 для embeddings». Cross-vendor latency, два білінги, два SDK-стилі, два failure modes. Виберіть одного постачальника як хребет, другого — лише коли є виміряна причина: наприклад, self-hosted Hermes для чутливих PII, Claude — для решти.

Рекомендація під use-case

E-commerce / SaaS / агенції — Claude Sonnet 4.5 як default. Найкращий баланс якості, швидкості та ціни. Переходьте на Opus 4.7, лише якщо виміряли, що Sonnet ламається на ваших edge-cases.

Високооб'ємний support / Telegram / voice — GPT-5 Mini. Дешевий, щоб робити retry, швидкий, щоб не відчувався ботом. Слідкуйте за OpenAI-білом — легко 10× за ніч.

Регульовані галузі (fintech, healthcare, держсектор) — Hermes 4 self-hosted, з Claude через Bedrock як fallback для нечутливих потоків. Дорожче в інженерії, рятує від будь-якого наративу про витік даних.

Не впевнені, яка модель пасує вашому кейсу?

Я не продаю моделі. Я допомагаю обрати ту, що відповідає вашим обмеженням. 30 хвилин дзвінка — слухаю процес, обсяги, рівень комплаєнсу, і кажу, куди яку модель ставити. Чесно, без апселу.

Написати @tribeofdanel →