Wan 2.7 / 2.6 Alibaba
Wan (Tongyi Wanxiang) — универсальная видео-модель Alibaba Cloud. Четыре сценария под одним эндпоинтом: текст→видео, картинка→видео (с опциональным аудио-драйвом для синхронизации губ), референс→видео и редактирование видео. Разрешения 720P / 1080P, длительность 2–15 секунд.
Модели и режимы
| Режим | Модель | Что нужно на вход |
|---|---|---|
| Текст→видео | wan2.7-t2v | Промпт |
| Картинка→видео | wan2.7-i2v | Первый кадр + промпт (+ опц. аудио-драйв — только у Wan) |
| Референс→видео | wan2.7-r2v | 1–5 референс-картинок/видео + промпт (+ голос-референс) |
| Редактирование видео | wan2.7-videoedit | Видео + 1–5 референс-картинок + инструкция (замена одежды/фона и т.п.) |
Доступна и предыдущая серия wan2.6-* (тот же протокол) — включая
wan2.6-r2v-flash: быстрый и более дешёвый тир для черновиков и подбора промпта.
Параметры (настройки в Студии)
| Параметр | По умолчанию | Допустимо |
|---|---|---|
| Разрешение | 720P | 720P / 1080P (480P и 4K не поддерживаются) |
| Соотношение сторон | 16:9 | 16:9 / 9:16 / 1:1 / 4:3 / 3:4 (в режиме «картинка→видео» берётся из первого кадра) |
| Длительность | 5 сек | 2–15 сек (с референс-видео — до 10; у «редактирования» — по длине исходного видео) |
| ✨ Улучшать промпт (prompt_extend) | включено | авто-расширение короткого промпта — рекомендуется |
| 💧 Водяной знак | выключен | метка «AI generated» в правом нижнем углу |
| 🎲 Seed | случайный | 0–2147483647; фиксирует для воспроизводимости |
| 🚫 Negative prompt | — | что исключить (до 500 символов) |
Что в каждом режиме
- Картинка→видео (i2v): загрузите первый кадр; при желании добавьте аудио-драйв — статичный портрет будет открывать рот в такт звуку (рэп / озвучка / цифровой человек). Аудио-драйв — эксклюзив Wan.
- Референс→видео (r2v): до 5 референс-изображений и/или видео суммарно (сохраняют персонажа/объект), плюс голос-референс. В промпте можно ссылаться: «image 1 / video 1».
- Редактирование (video-edit): загрузите исходное видео и 1–5 референс-картинок — замена одежды, фона и т.п. Длительность берётся из исходного видео.
Цены (по секундам, с наценкой +50%)
Текст→видео, картинка→видео и референс→видео тарифицируются одинаково; редактирование — по длине готового видео.
| Разрешение | Ставка | 5 сек | 10 сек | 12 сек |
|---|---|---|---|---|
| 720P | $0.126/сек | $0.63 | $1.26 | $1.51 |
| 1080P | $0.21/сек | $1.05 | $2.10 | $2.52 |
wan2.6-r2v-flash дешевле (быстрый тир). Тарифицируется по фактическим секундам готового видео;
неудачные генерации не списываются. Полный каталог — на странице Модели и цены.
Лучшие практики
- Итерируйте на 720P / 5 сек. Быстро проверьте промпт и движение камеры на коротком клипе, затем масштабируйте до 1080P и большей длительности.
- prompt_extend заметно улучшает короткие промпты — держите включённым.
- Аудио-драйв (i2v) — для синхронизации губ под речь/рэп; работает только в Wan.
- Время генерации: 720P/5с — 70–140 сек; 1080P или длинные клипы — могут превышать 5 минут. Можно покинуть вкладку — результат появится в истории.
Частые вопросы
Можно ли ещё использовать Wan 2.6?
Да — тот же протокол, достаточно выбрать модель wan2.6-*. wan2.6-r2v-flash —
быстрый дешёвый тир для черновиков.
Поддерживается ли 480P или 4K?
Нет, только 720P и 1080P.
Сколько хранится результат?
Готовый MP4 мы сразу скачиваем и кладём в историю у себя, поэтому ссылка не «протухает».