Seedance 2.0 NEW
ByteDance Seedance 2.0 — флагманская видео-модель (официальные ресурсы Volcengine): текст→видео, оживление кадра (первый / первый+последний), мульти-модальный референс (до 9 картинок + до 3 видео + до 3 аудио) и синхронный звук из коробки (речь, звуковые эффекты, музыка). 480p–1080p, 24 кадра/сек, мультиязычные промпты.
Две модели
| Модель | Качество | Когда выбрать |
|---|---|---|
doubao-seedance-2-0-260128 (standard) |
480p / 720p / 1080p | Максимальное качество и 1080p |
doubao-seedance-2-0-fast-260128 (fast) |
480p / 720p (без 1080p) | Дешевле и быстрее — для потока/черновиков |
Fast и standard — разные по цене: fast заметно дешевле при том же разрешении и длительности.
Режимы генерации
Режим определяется составом входных данных. Три «картиночных» режима взаимоисключающие.
| Режим | Что нужно на вход | Описание |
|---|---|---|
| Текст→видео | Промпт | Видео из текстового описания. |
| Первый кадр (i2v) | Промпт + 1 картинка | Картинка становится первым кадром и оживает. |
| Первый + последний кадр | Промпт + 2 картинки | Модель строит плавный переход между двумя кадрами. |
| Мульти-модальный референс (r2v) | 0–9 картинок + 0–3 видео + 0–3 аудио (минимум 1 картинка или 1 видео; аудио — только вместе с визуалом) | Сохраняет персонажа/объект/стиль; можно создавать, редактировать и продлевать видео. |
⚠️ Входные изображения/видео с лицами реальных людей отклоняются модерацией. Используйте сгенерированные или лицензированные ассеты.
Параметры (настройки в Студии)
| Параметр | Значение по умолчанию | Допустимо |
|---|---|---|
| Разрешение | 720p | 480p / 720p / 1080p (1080p — только standard) |
| Соотношение сторон | adaptive (авто) | 16:9 · 4:3 · 1:1 · 3:4 · 9:16 · 21:9 · adaptive |
| Длительность | 5 сек | целые 4–15 сек, либо «Авто» (модель сама выберет 4–15) |
| 🔊 Генерировать аудио | включено | речь, звуки, музыка синхронно с видео; выключите для немого ролика |
| 💧 Водяной знак | выключен | метка AI в правом нижнем углу |
| 🎲 Seed | случайный | фиксируйте для похожего (не идентичного) результата между запусками |
| 🖼️ Вернуть последний кадр | выключен | PNG последнего кадра без водяного знака — чтобы склеивать клипы (см. ниже) |
Кадр фиксирован — 24 fps. Внутри одного разрешения все соотношения стоят одинаково
(одна площадь в пикселях) — переключайте альбом/портрет бесплатно. Совет: для оживления кадра (i2v)
держите adaptive, чтобы модель подстроилась под пропорции вашей картинки и не обрезала её.
Разрешения и реальные размеры кадра
Тир разрешения задаёт площадь в пикселях, а не короткую сторону. Фактические размеры по соотношениям:
| Соотношение | 480p | 720p | 1080p (только standard) |
|---|---|---|---|
| 16:9 | 864×496 | 1280×720 | 1920×1080 |
| 4:3 | 752×560 | 1112×834 | 1664×1248 |
| 1:1 | 640×640 | 960×960 | 1440×1440 |
| 3:4 | 560×752 | 834×1112 | 1248×1664 |
| 9:16 | 496×864 | 720×1280 | 1080×1920 |
| 21:9 | 992×432 | 1470×630 | 2206×946 |
Цены
Тарификация — по объёму (площадь × длительность, по фактическим токенам готового видео), линейно зависит от длительности: ролик на 15 сек стоит примерно в 3× больше, чем на 5 сек. Все цены ниже — с нашей наценкой +50%, списываются по факту готовности. Отклонённые (ошибка параметров) и неудачные генерации не тарифицируются.
| Модель | 480p · 5с | 720p · 5с | 1080p · 5с |
|---|---|---|---|
doubao-seedance-2-0-260128 | ≈ $0.63 | ≈ $1.36 | ≈ $3.04 |
doubao-seedance-2-0-fast-260128 | ≈ $0.51 | ≈ $1.09 | — |
Цена за секунду пропорциональна (напр. fast 720p: 4с ≈ $0.87, 8с ≈ $1.74). Биллинг по реальным токенам, поэтому допустимо отклонение ±5%. Полный каталог — на странице Модели и цены.
Склейка длинных видео (последний кадр → первый)
Включите «Вернуть последний кадр» — после генерации появится кнопка «Продолжить клип →»: последний кадр без водяного знака подставится первым кадром нового ролика. Так можно собирать непрерывное видео из нескольких клипов с сохранением сцены и персонажей.
Лучшие практики
- Модель под задачу: standard — для 1080p и максимальной детализации; fast — для объёма (дешевле и быстрее).
- Длительность = регулятор цены. Проверяйте промпт на 5-секундных клипах, потом масштабируйте до 10–15 сек.
- Звук: по умолчанию включён. Выключите, если планируете накладывать свою звуковую дорожку.
- Реплики — в кавычках. Прямую речь в промпте берите в двойные кавычки — модель сама озвучит её голосом.
- adaptive против кропа. Для оживления картинки оставляйте соотношение «Авто», фиксируйте 9:16/16:9 только если этого требует площадка.
- Промпт: до ~1000 слов (англ.) / ~500 символов (кит.). Описывайте субъект + действие + движение камеры + свет/стиль. Языки: рус., англ., кит., яп., исп., порт., индонез.
Частые вопросы
Почему у видео есть звук и как его убрать?
Синхронный звук включён по умолчанию. Выключите переключатель «Генерировать аудио» в Студии.
Сколько хранится результат?
Готовый MP4 мы сразу пересохраняем у себя и кладём в историю, так что ссылка не «протухает»
(исходная ссылка провайдера живёт ~24 часа).
Что делает «Авто» (длительность −1)?
Модель сама выбирает длину 4–15 сек и тарифицирует по факту; итоговая длительность показывается в истории.
Портрет дороже альбома?
Нет. Внутри одного разрешения все соотношения имеют одинаковую площадь и стоят одинаково.
Можно загрузить фото реального человека?
Нет — модерация отклоняет реальные лица. Используйте сгенерированные/лицензированные ассеты.