Анализ видео (video understanding)

Отправьте видео в мультимодальную модель и получите описание сцен, действий, распознанный текст с кадров и ответы на вопросы по содержимому — с привязкой к таймкодам. Используется привычный эндпоинт https://megaapi.ru/v1/chat/completions.

ЭндпоинтPOST https://megaapi.ru/v1/chat/completions
МоделиМультимодальные Gemini (gemini-2.5-pro, gemini-2.5-flash) и Qwen-VL
Вход видеоbase64 data-URI или публичный URL в блоке контента сообщения
ТарификацияПо токенам модели (видео раскладывается на кадры). См. Модели и цены

Запрос (base64)

POST https://megaapi.ru/v1/chat/completions
Content-Type: application/json

{
    "model": "gemini-2.5-flash",
    "messages": [{
        "role": "user",
        "content": [
            { "type": "text", "text": "Опиши, что происходит, и дай таймкоды ключевых сцен" },
            { "type": "video_url", "video_url": { "url": "data:video/mp4;base64,AAAA..." } }
        ]
    }]
}

Запрос (по URL)

{ "type": "video_url", "video_url": { "url": "https://example.com/clip.mp4" } }

Что можно спросить

Длинные ролики потребляют больше токенов (больше кадров) — для дешёвого анализа выбирайте flash-модели и ограничивайте длительность.

Vision (изображения на вход) Генерация видео