Kimi K2.5 Moonshot AI

Нативный мультимодальный флагман Moonshot AI: контекст 256K без доплаты, режим Thinking для глубоких рассуждений, сильный визуальный кодинг (превращает скриншоты и макеты в рабочий код) и оркестрация агентов. OpenAI-совместимый эндпоинт, ID модели — kimi-k2.5.

Главное отличие: в отличие от официального сайта Kimi, по умолчанию модель работает в режиме Instant. Режим рассуждений нужно явно включить через enable_thinking: true в теле запроса.

Характеристики

ПараметрЗначение
Model IDkimi-k2.5
Контекст256 000 токенов (без доплаты)
РежимыInstant / Thinking / Agent / Agent Swarm
Включение Thinkingenable_thinking: true (по умолчанию false)
ВходТекст + изображение (нативный мультимодал)
ВыходТекст
Стриминг / Tool use✅ Поддерживаются

Цены

ТипЦена
Input$0.60 / 1M токенов
Output$2.50 / 1M токенов
Cache Hit (Input)$0.10 / 1M токенов

Актуальные ставки с наценкой — в разделе Модели и цены.

Когда включать Thinking

Сценарийenable_thinking
Быстрый диалог / короткие ответыfalse (по умолчанию) — минимальная задержка
Сложные рассуждения, планирование кода, RCAtrue — модель выдаёт трассу рассуждений
Агент со встроенным $web_searchfalse — web_search и Thinking взаимоисключающи

Примеры

Instant (по умолчанию)

curl https://megaapi.ru/v1/chat/completions \
  -H "Authorization: Bearer sk-..." \
  -H "Content-Type: application/json" \
  -d '{
    "model": "kimi-k2.5",
    "messages": [{"role": "user", "content": "Представься одним предложением."}]
  }'

Thinking (через extra_body)

from openai import OpenAI
client = OpenAI(api_key="sk-...", base_url="https://megaapi.ru/v1")

response = client.chat.completions.create(
    model="kimi-k2.5",
    messages=[
        {"role": "system", "content": "Ты — полезный ассистент."},
        {"role": "user", "content": "Проанализируй сложность кода и предложи оптимизации."}
    ],
    extra_body={"enable_thinking": True},
)
print(response.choices[0].message.content)

В openai-python поле enable_thinking передаётся внутри extra_body; в Node.js SDK — как поле верхнего уровня тела запроса.

Лучшие практики

Открыть в Студии → Текстовая генерация Все модели