Семейство Gemini (Google)

Gemini — мультимодальное семейство LLM от Google, работающее с текстом, изображениями, аудио, видео и кодом. Линейка (Ultra / Pro / Flash / Nano) предлагает разные компромиссы между возможностями, задержкой и стоимостью. Gemini 1.5 Pro представил контекстное окно в 1 миллион токенов; Gemini 2.x добавил нативный tool use, выполнение кода и grounding через Google Search. Модели доступны через Google AI Studio (прототипирование) и Vertex AI (продакшен). API использует интерфейс generateContent с мультимодальными входными данными и поддерживает function calling, JSON mode и streaming.

Как это работает

Семейство Gemini (Google): проприетарные frontier — Claude (Anthropic), GPT-4/5 (OpenAI), Gemini (Google), DeepSeek. Open-weight сильные — Llama 4 (Meta), Qwen 3 (Alibaba), DeepSeek V3, Mistral. Российские: GigaChat (Sber), YandexGPT (Yandex). Для деплоев на RF-инфре RF-resident модели обязательны по локальному compliance — выбирайте GigaChat или YandexGPT. Для local/on-prem — Llama, Qwen, DeepSeek на commodity GPU через Ollama / vLLM / llama.cpp.

Когда применять

Для РФ-проектов (по Hard Rule #4) — GigaChat / YandexGPT. Для US/EU/global выбирайте по задаче + бюджету — Sonnet/GPT-4 для качества, Haiku/GPT-4 mini для цены. Для on-prem (compliance, data sovereignty) Llama 4 70B / Qwen 3 / DeepSeek работают на 1-2 A100/H100 GPU. Бенчмаркьте на своей задаче — Chatbot Arena и MMLU шумные; ваши task-evals бьют оба.

Типичные ошибки

Ловушки Семейство Gemini (Google): выбор по Twitter-хайпу без бенчмарка (модель X "ощущается умной" на demo-промптах, падает на реальной нагрузке); локирование в одного провайдера через SDK-специфичные фичи (OpenAI-совместимые API где возможно); не трекают deprecations моделей (старые версии sunset → ваш prod ломается).

Как это работает

Когда применять

Типичные ошибки

Связанные понятия

Полезные ресурсы