Исследование Zinin Corporation

CLI-Агенты для Кодинга

Только подписки · Бенчмарки · Opus 4.6 vs Мир

Февраль 2026 · Подготовил: Zinin Corp AI

8 CLI-инструментов и их тарифы

🇺🇸 Claude Code
Anthropic
от
$20/мес
Модель: Opus 4.6 / Sonnet 4.6
Pro: $20 Max 5x: $100 Max 20x: $200
SWE-bench Verified
80.8%
CLI: claude
Контекст: 1M β
Terminal-Bench: 65.4%

Плюсы

  • Лучший reasoning
  • Agent Teams
  • 1M контекст

Минусы

  • Дорого
  • Только модели Anthropic
Подробные тарифы
Pro Sonnet, 10-40 промптов/5ч $20/мес
Max 5x Opus 4.6, 5x лимиты $100/мес
Max 20x Opus 4.6, 20x лимиты $200/мес
🇺🇸 Gemini CLI
Google
от
БЕСПЛАТНО
Модель: Gemini 3.1 Pro
Free: $0 AI Pro: $20 AI Ultra: $250
SWE-bench Verified
76.2%
CLI: gemini
Контекст: 2M
Terminal-Bench: 56.2%

Плюсы

  • Бесплатный тир!
  • 2M контекст
  • Open source

Минусы

  • Слабее в coding
  • Нет Agent Teams
Подробные тарифы
Free 1000 запр/день, Gemini 2.5 Pro БЕСПЛАТНО
AI Pro Gemini 3 Pro, выше лимиты $20/мес
AI Ultra Макс. лимиты, 3.1 Pro $250/мес
🇺🇸 ChatGPT Codex
OpenAI
от
$20/мес
Модель: GPT-5.3-Codex
Plus: $20 Pro: $200
SWE-bench Verified
75.4%
CLI: codex
Контекст: 400K
Terminal-Bench: 77.3%

Плюсы

  • Лучший Terminal-Bench
  • Cloud execution
  • Async задачи

Минусы

  • Дорого
  • CLI ограничен
Подробные тарифы
Plus 30-150 сообщ/5ч $20/мес
Pro 300-1500 сообщ, cloud exec $200/мес
🇨🇳 GLM Coding Plan
Zhipu AI (Z.ai)
от
$6/мес
Модель: GLM-5 / GLM-4.7
Lite: $6 Pro: $15 Max: $40
SWE-bench Verified
77.8%
CLI: Claude Code / Cline / OpenCode
Контекст: 200K

Плюсы

  • Дёшево!
  • MIT лицензия
  • Работает в Claude Code

Минусы

  • Throttling в пиках
  • Нет своего CLI
Подробные тарифы
Lite ~120 промптов/5ч, GLM-4.7 $6/мес
Pro ~600 промптов/5ч, GLM-5 $15/мес
Max Макс. лимиты, GLM-5 $40/мес
🇨🇳 Alibaba Coding Plan
Alibaba Cloud
от
$10/мес
Модель: Qwen3.5-Plus / Qwen3-Coder
Lite: $10 Pro: $50
SWE-bench Verified
70.6%
CLI: Qwen Code / Claude Code / Cline
Контекст: 256K

Плюсы

  • 90K запр/мес!
  • 201 язык
  • Qwen Code CLI

Минусы

  • Слабее бенчмарки
  • Сложная настройка
Подробные тарифы
Lite 18K запр/мес $10/мес
Pro 90K запр/мес $50/мес
🇨🇳 MiniMax Coding Plan
MiniMax
от
$10/мес
Модель: MiniMax M2.5
Starter: $10 Plus: $20 Max: $50
SWE-bench Verified
80.2%
CLI: Cline / OpenCode
Контекст: 205K

Плюсы

  • 80.2% SWE — почти Opus!
  • 100 TPS Lightning
  • Open weights

Минусы

  • Молодая платформа
  • Throttling риски
Подробные тарифы
Starter ≈ Claude Max 5x $10/мес
Plus ≈ Claude Max 20x $20/мес
Max ≈ Claude Max 20x+ $50/мес
🇨🇳 Kimi Membership
Moonshot AI
от
БЕСПЛАТНО
Модель: Kimi K2.5
Free: $0 Moderato: $19
SWE-bench Verified
нет данных
CLI: Cline / Kilo Code
Контекст: 256K

Плюсы

  • Бесплатный тир
  • 256K контекст
  • Agent Swarm

Минусы

  • Нет SWE-bench данных
  • Еженедельные квоты
Подробные тарифы
Free Базовый доступ БЕСПЛАТНО
Moderato 2-3.5K запр/неделю $19/мес
🇺🇸 GitHub Copilot
GitHub / Microsoft
от
$10/мес
Модель: Мульти-модель
Pro: $10 Pro+: $39
SWE-bench Verified
нет данных
CLI: gh copilot
Контекст: Varies

Плюсы

  • $10/мес!
  • Мульти-модель
  • GitHub интеграция

Минусы

  • Не полноценный агент
  • Огранич. premium запросы
Подробные тарифы
Pro 300 premium запр + completion $10/мес
Pro+ Claude Opus 4.5 + GPT-5 $39/мес

SWE-bench & Terminal-Bench

SWE-bench Verified — решение реальных GitHub Issues

Февраль 2026 · Независимый лидерборд · Стандартный промпт для всех моделей

1 Claude Sonnet 4.5
82.0%
в Claude Code
2 Claude Opus 4.6
80.8%
$100-200/мес
3 MiniMax M2.5
80.2%
$10-50/мес
4 Claude Sonnet 4.6
79.6%
$20/мес
5 GLM-5
77.8%
$6-40/мес
6 Gemini 3 Flash
76.2%
$0-250/мес
7 GPT-5.2
75.4%
$20-200/мес
8 Qwen3-Coder
70.6%
$10-50/мес
Ключевой инсайт

MiniMax M2.5 за $10-50/мес показывает 80.2% — всего на 0.6% ниже Opus 4.6 за $200/мес. GLM-5 за $6-40/мес набирает 77.8%. Разрыв между «дешёвыми» и «премиальными» моделями сократился до минимума.

Terminal-Bench 2.0 — работа в терминале

Навигация по CLI, shell-команды, отладка

1 GPT-5.3 Codex
77.3%
$200/мес
2 Claude Opus 4.6
65.4%
$100-200/мес
3 Claude Opus 4.5
59.8%
4 Claude Sonnet 4.6
59.1%
$20/мес
5 Gemini 3 Pro
56.2%
$0-250/мес
6 Claude Sonnet 4.5
51.0%

Opus 4.6 vs Opus 4.5 — что изменилось?

SWE-bench Verified
4.5: 80.9% → 80.8% −0.1%
Terminal-Bench 2.0
4.5: 59.8% → 65.4% +5.6%
ARC AGI 2
4.5: 37.6% → 68.8% +31.2%
OpenRCA (диагностика)
4.5: 26.9% → 34.9% +8.0%
MRCR v2 (1M)
4.5: 18.5%* → 76.0% +57.5%
Контекст
4.5: 200K → 1M β 5x

* Sonnet 4.5 для MRCR. Opus 4.6 — не лучше в написании кода, но значительно лучше как оператор среды разработки: навигация, отладка, контекст, Agent Teams.

Сравнительная матрица подписок

Инструмент Мин. цена Макс. цена SWE-bench Контекст Свой CLI В Claude Code
🇺🇸 Claude Code $20/мес $200/мес 80.8% 1M β
🇺🇸 Gemini CLI БЕСПЛАТНО $250/мес 76.2% 2M
🇺🇸 ChatGPT Codex $20/мес $200/мес 75.4% 400K
🇨🇳 GLM Coding Plan $6/мес $40/мес 77.8% 200K
🇨🇳 Alibaba Coding $10/мес $50/мес 70.6% 256K
🇨🇳 MiniMax Coding $10/мес $50/мес 80.2% 205K
🇨🇳 Kimi Membership БЕСПЛАТНО $19/мес 256K
🇺🇸 GitHub Copilot $10/мес $39/мес Varies

Цена vs Качество — где лучшее соотношение?

Минимальная цена подписки → SWE-bench результат

85% 80% 75% 72% 70% 68%
$0 $6 $10 $20 $50+
Gemini
GLM
MiniMax
Alibaba
Claude
Codex

↑ Выше = лучше качество · ← Левее = дешевле · Идеальная зона: верхний левый угол

Оптимальные стеки

Премиальный стек (всё на Opus)

$200/мес

Claude Code Max 20x → Opus 4.6 полный доступ, 20x лимиты

SWE-bench 80.8% · Terminal-Bench 65.4% · 1M контекст · Agent Teams

Оптимальный стек — экономия 55%

$90/мес
MiniMax Plus SWE 80.2% — почти Opus! $20/мес
Claude Code Pro Sonnet 4.6 для сложного $20/мес
Gemini CLI Free 1M контекст, рефакторинг БЕСПЛАТНО
GLM Coding Lite Рутинные задачи $6/мес
Alibaba Lite 201 язык, 18K запр/мес $10/мес
GitHub Copilot Pro Автокомплит + мульти-модель $10/мес
Итого: $66/мес → Экономия $134/мес ($1,608/год)

Ультра-бюджет — экономия 90%

$16/мес
MiniMax Starter SWE 80.2% ≈ Opus уровень $10/мес
GLM Coding Lite GLM-5 SWE 77.8% $6/мес
Gemini CLI Free Бесплатно, 1M контекст БЕСПЛАТНО
Итого: $16/мес → Экономия $184/мес ($2,208/год) · SWE-bench до 80.2%!

Ответ на главный вопрос

Да, GLM от Z.ai — можно использовать за $6-40/мес вместо $200. GLM-5 набирает 77.8% SWE-bench (Opus 4.6 = 80.8%). Работает прямо внутри Claude Code.

Да, Gemini 3 Proбесплатно через Gemini CLI, 1000 запросов в день. Или $20/мес за AI Pro с повышенными лимитами.

MiniMax M2.5 — главная находка: $10-50/мес, а SWE-bench 80.2% — разница с Opus 4.6 всего 0.6 процентных пункта!

Alibaba Coding Plan — $10-50/мес, до 90K запросов. Qwen3.5-Plus + Qwen3-Coder. Работает в Claude Code и Qwen Code CLI.

Kimi K2.5 — $19/мес, 256K контекст, Agent Swarm. Есть бесплатный тир.

О чём помнить

SWE-bench ≠ реальный опыт. Opus 4.6 остаётся лучшим по reasoning, Agent Teams, 1M контексту и диагностике. Дешёвые модели закрывают 70-80% задач, но для сложной архитектуры Opus незаменим.

Китайские сервисы — throttling в пиках, вопросы конфиденциальности данных, возможные ценовые повышения (GLM уже +30%).

Рекомендация: гибридный стек — Opus для 20-30% сложных задач, дешёвые модели для 70-80% рутины.