Выбор Правильной Модели

Выбирайте модель Claude, балансируя возможности, задержку и стоимость под задачу. Текущее семейство: Opus (максимум качества и цены), Sonnet (сбалансированный дефолт для прод-нагрузок) и Haiku (самая быстрая и дешёвая). Haiku подходит для массовой классификации и извлечения данных; Sonnet — для общих агентских и кодинг-сценариев; Opus — только когда замерили реальный прирост качества. Базовый сценарий — последняя Sonnet; продвинутый — роутинг между моделями по запросу или удешевление пачек через Message Batches API. Помните: snapshot фиксируется в имени — claude-sonnet-4-5 ссылается на конкретную дату.

Как это работает

Выбор Правильной Модели: на 2026 семейство Claude — линейка Claude 4.x (Opus, Sonnet, Haiku — от крупнейшей к меньшей). Контекстные окна до 1M токенов на некоторых моделях. Цена масштабируется с размером + длиной контекста. Модели поддерживают text + image input + структурированный output (JSON mode, tool use). Каждый релиз продвигает рассуждение, code-генерацию, agentic-возможности. Версии запиниваются model-идентификаторами (например claude-opus-4-7).

Когда применять

Haiku — для high-volume рутинной работы, где важны скорость + цена (классификация, извлечение, роутинг). Sonnet — разумный дефолт для чата + кода + multi-step рассуждения. Opus — когда реально нужен top-tier reasoning и можете себе позволить. Prompt caching (cache TTL + cache control заголовки) — для драматического сокращения цены повторяющегося контекста.

Типичные ошибки

Ловушки Выбор Правильной Модели: пин на "claude-3-opus-latest" (rolling model name — output меняется тихо на новом релизе); игнор rate-лимитов + всплески (HTTP 429, который вы не обработали); Opus для тривиальных задач ($$$); не меряют стоимость на запрос (LLM-счета удивляют на масштабе). Всегда пиньте конкретную version-строку модели.

Как это работает

Когда применять

Типичные ошибки

Связанные понятия

Полезные ресурсы