Озвучка (Text-to-Speech)

Превращайте текст в естественную речь. Эндпоинт совместим с OpenAI Speech. Проще всего — в ИИ-Студии (вкладка «Озвучка»): выбор модели и голоса, предпрослушка, регулятор скорости, выбор формата, плеер и история.

Эндпоинт	`POST https://megaapi.ru/v1/audio/speech`
Ответ	Бинарный аудиопоток (mp3 / opus / aac / flac / wav)
Лимит текста	до 8000 символов за запрос (в Студии)

Модели, голоса и возможности

Модель	Голоса	Скорость	Формат	Цена (с наценкой)
`tts-1`	11 голосов OpenAI	✓ 0.25–4.0×	mp3 / opus / aac / flac / wav	$45 / 1M симв.
`tts-1-hd`	11 голосов OpenAI	✓ 0.25–4.0×	mp3 / opus / aac / flac / wav	$90 / 1M симв.

tts-1 — быстрее и дешевле, tts-1-hd — выше качество звука. Цены финальные (с наценкой); тарификация по числу символов. Полный прайс — на странице Модели и цены.

О других моделях озвучки. gpt-4o-mini-tts и Gemini-TTS (gemini-2.5-flash-tts и т.п.) сейчас недоступны на нашем тарифе — провайдер не отдаёт под них каналы (запрос вернёт ошибку «модель недоступна», деньги не спишутся). Поэтому в Студии показаны только рабочие модели tts-1 и tts-1-hd. Как только каналы появятся — добавим модели обратно.

Голоса OpenAI (tts-1 / tts-1-hd)

alloy, ash, ballad, coral, echo, fable, onyx, nova, sage, shimmer, verse

В Студии можно прослушать короткий пример любого голоса кнопкой «▶ Пример».

Запрос

POST https://megaapi.ru/v1/audio/speech
Authorization: Bearer sk-...
Content-Type: application/json

{
    "model": "tts-1-hd",
    "voice": "nova",
    "input": "Привет! Это синтезированная речь.",
    "response_format": "mp3",
    "speed": 1.0
}

Пример на Python

from openai import OpenAI
client = OpenAI(api_key="sk-...", base_url="https://megaapi.ru/v1")

resp = client.audio.speech.create(
    model="tts-1-hd",
    voice="nova",
    input="Привет! Это синтезированная речь.",
)
resp.stream_to_file("speech.mp3")

Параметры

Параметр	Описание
`model`	`tts-1` или `tts-1-hd`.
`voice`	Один из 11 голосов OpenAI (см. выше).
`input`	Текст для озвучки (до 8000 символов).
`response_format`	`mp3` (по умолчанию) / `opus` / `aac` / `flac` / `wav`.
`speed`	Темп речи 0.25–4.0 (по умолчанию 1.0).

Советы

Для веба используйте mp3 (компактно и совместимо); для монтажа без потерь — flac / wav.
tts-1 — когда важна скорость и цена; tts-1-hd — когда важно качество звука.
За неудачные ответы без аудио деньги не списываются.

Открыть ИИ-Студию → Все модели