Озвучка (Text-to-Speech)

Превращайте текст в естественную речь. Эндпоинт совместим с OpenAI Speech. Проще всего — в ИИ-Студии (вкладка «🔊 Озвучка»): выбор модели и голоса, предпрослушка, регулятор скорости, тон для gpt-4o-mini-tts, плеер и история.

ЭндпоинтPOST https://megaapi.ru/v1/audio/speech
ОтветБинарный аудиопоток (mp3 / opus / aac / flac / wav)
Лимит текстадо 8000 символов за запрос (в Студии)

Модели, голоса и возможности

МодельГолосаСкоростьТон (instructions)ФорматЦена (с наценкой)
tts-1 11 голосов OpenAI ✅ 0.25–4.0× mp3 / opus / aac / flac / wav $45 / 1M симв.
tts-1-hd 11 голосов OpenAI ✅ 0.25–4.0× mp3 / opus / aac / flac / wav $90 / 1M симв.
gpt-4o-mini-tts 11 голосов OpenAI ✅ управление тоном/эмоцией mp3 / opus / aac / flac / wav $18 / 1M симв.
gemini-2.5-flash-tts, gemini-2.5-pro-tts 30 голосов Gemini только wav по токенам, см. каталог

Голоса OpenAI (tts-1 / tts-1-hd / gpt-4o-mini-tts)

alloy, ash, ballad, coral, echo, fable, onyx, nova, sage, shimmer, verse

Голоса Gemini TTS

Kore, Puck, Charon, Zephyr, Fenrir, Aoede, Leda, Orus и ещё 22 именованных голоса. Для Gemini формат фиксируется на wav — другие форматы провайдер может вернуть пустыми.

Запрос

POST https://megaapi.ru/v1/audio/speech
Authorization: Bearer sk-nexus-...
Content-Type: application/json

{
    "model": "tts-1-hd",
    "voice": "nova",
    "input": "Привет! Это синтезированная речь.",
    "response_format": "mp3",
    "speed": 1.0
}

Управление тоном (gpt-4o-mini-tts)

{
    "model": "gpt-4o-mini-tts",
    "voice": "coral",
    "input": "Заказ оформлен, спасибо за покупку!",
    "instructions": "Говори бодро и дружелюбно, с лёгкой улыбкой"
}

Чтобы не получать ошибок

Открыть ИИ-Студию → Все модели