API пакетов сообщений

Тема дорожной карты · Claude от Anthropic

API пакетов сообщений от Anthropic позволяет асинхронно обрабатывать до 100K запросов или 256 МБ данных с существенной экономией — 50% от обычной стоимости. Это идеально подходит для выполнения массовых задач, таких как оценка данных, классификация и создание датасетов, где немедленный ответ не требуется. Основной вызов API осуществляется через POST /v1/messages/batches, а продвинутые функции включают использование prompt caching и Files API для оптимизации стоимости и упрощения повторяемых процессов.

Как это работает

API пакетов сообщений работает с использованием официальных SDK, доступных на Python (anthropic), TypeScript (@anthropic-ai/sdk), Java и Go. Эти SDK обеспечивают автоматическое обработку повторных попыток, потоковой передачи данных и безопасного построения запросов. Важно отметить, что SDK также поддерживают кэширование промптов, что позволяет значительно снизить затраты на повторяющиеся запросы.

Когда применять

SDK API пакетов сообщений рекомендованы для использования в любых случаях, где требуется обработка большого количества запросов. Вместо написания собственного HTTP-клиента, стоит воспользоваться готовыми SDK, которые предоставляют удобные и типизированные интерфейсы для взаимодействия с API. Для более сложных сценариев, таких как построение агентов с определёнными навыками и интеграциями, следует использовать Agent SDK, который предоставляет высокий уровень абстракций для управления потоком выполнения и интеграции с различными инструментами.

Типичные ошибки

Когда работают с API пакетов сообщений, важно учитывать несколько типичных ошибок. Например, неправильное ожидание потоковых ответов может привести к обрыву данных, а неправильная обработка частичного JSON может привести к ошибкам парсинга. Также стоит избегать жёсткого кодирования версий моделей в клиентском коде, вместо этого используя переменные окружения для динамического определения версий. Наконец, важно помнить, что API пакетов сообщений предназначен для обработки множества запросов, поэтому попытки использования его для обработки одного запроса могут привести к ненужной сложности и ухудшению производительности.

Связанные понятия

Полезные ресурсы