Поддержка PDF и документов

Тема дорожной карты · Claude от Anthropic

Поддержка PDF и документов в Claude позволяет пользователям загружать и анализировать различные типы документов, включая текстовые файлы и графические изображения. Эта функциональность особенно полезна для автоматизации процессов анализа и обработки данных. Claude может извлекать текст из PDF-файлов, сохраняя при этом структуру и форматирование оригинального документа.

Ключевым преимуществом поддержки PDF и документов является возможность обработки сложных структурированных данных, таких как отчеты, презентации и другие форматы документов. Это позволяет пользователям получать более точные и детализированные ответы, основанные на содержимом загруженных файлов. Кроме того, эта функция упрощает процесс анализа данных, позволяя Claude автоматически обрабатывать и интерпретировать информацию из различных источников.

Как это работает

Messages API Claude принимает PDF-файлы как встроенный блок контента, что позволяет модели видеть как текст, так и визуальные элементы, такие как диаграммы и схемы. Файлы могут быть переданы либо инлайном через base64-блок document, либо по URL. При этом каждая страница PDF преобразуется в изображение и текст, что учитывается в общем количестве входных токенов модели.

API Claude поддерживает мультимодальные запросы, позволяющие использовать Claude для анализа и обработки различных типов данных. Это особенно полезно для анализа сложных документов, где требуется понимание не только текста, но и графических элементов. Кроме того, Claude может использовать мультимодальные тарифы Sonnet или Opus для обработки таких запросов.

Когда применять

SDK Claude лучше использовать вместо непосредственного обращения к Messages API через HTTP. Это позволяет автоматизировать обработку ошибок, управления скоростью запросов, потоковых ответов и других аспектов взаимодействия с API. Всегда устанавливайте явное значение max_tokens для каждого запроса, чтобы избежать использования неоптимальных значений по умолчанию.

Кеширование промптов, которые не изменяются между запросами (например, системные промпты и несколько примеров), помогает значительно снизить стоимость запросов. Это особенно полезно для повторного анализа одного и того же документа, когда требуется только обновление данных или изменение входных параметров.

Типичные ошибки

При использовании поддержки PDF и документов важно избегать некоторых распространенных ошибок. Например, не обрабатывать ошибки 429, которые возникают при превышении лимита запросов; не утечка API-ключа в клиентских скриптах JavaScript; игнорирование поля usage в ответах API, которое отражает стоимость запроса; и установка слишком больших значений max_tokens, что может привести к замедлению обработки и увеличению стоимости запроса.

Связанные понятия

Полезные ресурсы