Qwen 3.6
Новое поколение семейства Qwen: флагман для кода Max-Preview, быстрый
мультимодальный Flash, сбалансированный Plus и два
open-weight варианта — 27B и 35B-A3B. Все пять работают
через единый эндпоинт https://megaapi.ru/v1/chat/completions (OpenAI-совместимо).
Модели и цены
| Модель | Назначение | Контекст | Цена (с наценкой) |
|---|---|---|---|
qwen3.6-max-preview |
Флагман: код, сложные рассуждения, агенты | 262K | $1.92 / $11.52 за 1M токенов |
qwen3.6-flash |
Быстрый, мультимодальный (текст/изобр./видео) | 256K → 1M | $0.255 / $1.53 за 1M токенов |
qwen3.6-plus |
Сбалансированная «рабочая лошадка» | 1M | $0.45 / $2.70 за 1M токенов |
qwen3.6-27b |
Open-weight, сильный код | — | $0.63 / $3.78 за 1M токенов |
qwen3.6-35b-a3b |
Open-weight MoE, дёшево и быстро | — | $0.39 / $2.34 за 1M токенов |
Цены финальные (с наценкой), указаны для базового тарифного диапазона входных токенов. У закрытых моделей (Max-Preview / Flash / Plus) тариф ступенчатый: при очень больших запросах (Max-Preview сверх 128K, Flash/Plus сверх 256K входных токенов) ставка за весь запрос выше. Open-weight модели (27B / 35B-A3B) — единая ставка без ступеней. Полный каталог — Модели.
Как выбрать
| Задача | Модель |
|---|---|
| Coding-агент, сложное планирование, математика | qwen3.6-max-preview |
| Массовая обработка, мультимодальность, длинный контекст | qwen3.6-flash |
| Повседневный диалог, поддержка, knowledge-base Q&A | qwen3.6-plus |
| Бюджетный код / нужны открытые веса | qwen3.6-27b |
| Высокочастотные дешёвые сценарии | qwen3.6-35b-a3b |
Запрос
POST https://megaapi.ru/v1/chat/completions
Authorization: Bearer sk-nexus-...
Content-Type: application/json
{
"model": "qwen3.6-plus",
"messages": [
{ "role": "user", "content": "Объясни, что такое архитектура MoE" }
],
"stream": true
}
Мультимодальный вход (Flash)
{
"model": "qwen3.6-flash",
"messages": [{ "role": "user", "content": [
{ "type": "text", "text": "Опиши изображение" },
{ "type": "image_url", "image_url": { "url": "https://..." } }
]}]
}
Рекомендации
- Все модели поддерживают
tools(function calling) иstream: true. - Таймаут клиента ставьте ≥ 120 сек — длинные рассуждения и большой контекст считаются дольше.
- Следите за порогом тарифа: суммаризируйте/чанкуйте сверхдлинный контекст, чтобы не попасть в верхнюю ступень.
max-preview— это Preview-сборка; для критичных потоков прогоните небольшой канареечный тест.