SFEROOM logo

Seedance 2 в Sferoom: как писать промпты и получать сильные AI-видео

Seedance 2 — это модель для генерации коротких AI-видео. Но хороший результат здесь зависит не от магической фразы, а от постановки: кто в кадре, что происходит, как движется камера, какие референсы используются и какой звук должен сопровождать сцену.

В Sferoom с этим проще: промпт можно писать на русском. Под капотом Sferoom подготавливает инструкцию для модели: приводит её к понятной структуре, учитывает выбранный формат видео и перед отправкой адаптирует смысл под английский язык, потому что англоязычные кинематографические формулировки обычно понятнее видео-моделям.

Пользователь пишет: «супергерой Sferoom летит над Москвой». Sferoom превращает это в режиссёрскую инструкцию: объект, действие, городская среда, камера, свет, движение, звук и ограничения стабильности.

Почему простой промпт часто даёт слабый результат

Плохой промпт обычно звучит так: «Сделай красивое кинематографичное видео, герой летит по городу, эпично, реалистично». В нём есть настроение, но нет постановки. Модель не знает, какой город, какие машины, как летит герой, где камера, что должно быть в начале и чем сцена заканчивается.

Для видео важны не только объекты, но и время. Seedance 2 должен понимать последовательность: сначала герой стоит на крыше, потом прыгает, потом летит между домами, потом финальный крупный план. Поэтому сильный промпт похож не на описание картинки, а на раскадровку.

Кнопка «Улучшить»: зачем она нужна

В Sferoom есть кнопка «Улучшить». Её задача — взять сырой русский промпт и переписать его по канонам Seedance 2. Это особенно полезно, если вы понимаете идею, но не хотите вручную думать про объективы, свет, композицию и движение камеры.

Кнопка «Улучшить» добавляет к промпту ключевые блоки:

  • Subject — кто или что находится в кадре: внешность, одежда, эмоция, действие.
  • Camera — тип кадра и движение: крупный план, общий план, dolly, tracking, static, handheld.
  • Lighting — источник света, настроение, время суток, контраст.
  • Motion — что именно движется и с какой скоростью.
  • Style — реализм, рекламная съёмка, клиповый стиль, плёнка, объектив, грейдинг.
  • Mood — эмоциональный тон: драматично, энергично, интимно, загадочно, радостно.

Пример сырого промпта:

Парень в худи идёт ночью по Москве, вокруг огни, он слушает новый трек.

Что стоит получить после улучшения по смыслу:

Молодой артист в тёмном худи идёт по мокрой московской улице ночью, в наушниках, с сосредоточенным выражением лица. Камера следует за ним сбоку в плавном tracking shot, отражения фонарей и вывесок скользят по асфальту, позади проезжают старые Лады и маршрутки. Холодный сине-оранжевый свет, лёгкая плёночная текстура, реалистичный клиповый стиль, слышны шаги, шум города и приглушённый бас трека.

Такой промпт уже не просто «красивый». Он управляет результатом.

Режим 1: Text-to-Video — когда есть только идея

Text-to-Video подходит, когда у вас нет готовой картинки или видео-референса. Вы описываете сцену словами, а Seedance 2 создаёт видео с нуля.

Лучше использовать этот режим для:

  • быстрых идей для Reels, Shorts и TikTok;
  • атмосферных сцен и b-roll;
  • тизеров музыкального релиза;
  • рекламных концептов до съёмки;
  • проверки визуального направления.

Пример на русском:

Вертикальное видео 9:16. Молодой артист идёт ночью по мокрой московской улице после дождя, в наушниках, вокруг отражения фонарей и вывесок. Камера плавно следует сбоку, затем медленно приближается к лицу. Атмосфера клипа к новому треку, холодный сине-оранжевый свет, лёгкая плёночная текстура, слышны шаги, машины и приглушённый бас.

Этот режим даёт больше свободы модели. Он хорош для поиска идеи, но хуже удерживает конкретного персонажа или продукт, если они должны выглядеть строго одинаково.

Режим 2: Image-to-Video — когда нужно оживить картинку

Image-to-Video нужен, когда у вас уже есть изображение: персонаж, обложка, продукт, герой, аватар, кадр клипа. Картинка становится визуальным якорем, а промпт объясняет, что должно двигаться.

Главное правило: не надо заново описывать всё, что уже видно на картинке. Лучше описывать движение.

Плохо:

На картинке девушка в красной куртке, у неё тёмные волосы, она стоит в комнате, сделай красиво.

Лучше:

Используй изображение как точный референс внешности и одежды. Девушка медленно поворачивает голову к камере, моргает, волосы слегка двигаются от ветра, камера делает плавный push-in к лицу. Фон остаётся стабильным, свет мягкий и тёплый, без изменения лица, одежды и пропорций.

Этот режим лучше всего использовать для:

  • оживления обложки трека;
  • анимации AI-артиста;
  • персонажей и маскотов;
  • продуктовых карточек;
  • сцен, где важна стабильная внешность.

Режим 3: Omni Reference — когда нужны картинки, видео и звук

Omni Reference — самый управляемый режим. В нём можно использовать разные типы референсов: изображения, видео и аудио. В Sferoom для Seedance 2 это основной режим, когда нужно не просто сгенерировать ролик, а точно направить модель.

Логика простая:

  • Картинка отвечает за внешность персонажа, продукт или стиль.
  • Видео отвечает за движение камеры, темп, жесты или хореографию.
  • Аудио отвечает за настроение, ритм, голос, музыку или синхронизацию.

Пример:

Используй изображение 1 как точный референс персонажа: сохрани костюм, цвета, логотип и пропорции. Используй видео 1 только как референс движения камеры: плавный полёт вперёд между зданиями. Используй аудио 1 как ритм и настроение. Герой Sferoom летит над вечерней Москвой между панельными домами, внизу старые Жигули, Москвичи, маршрутки, мокрый асфальт и русские вывески. Сине-фиолетовая энергия тянется за руками как музыкальные волны, камера следует сбоку, финал — герой зависает над улицей на фоне огней города.

Omni Reference лучше выбирать для клипов, рекламы, персонажей, fashion-видео, AI-аватаров, музыкальных визуалов и любых задач, где один текст уже не даёт нужного контроля.

Standard и Fast: качество или скорость

В Sferoom у Seedance 2 есть режимы скорости: Standard и Fast.

Режим Когда выбирать Что учитывать
Standard Финальные ролики, реклама, клипы, сложные сцены, важные персонажи Лучше качество и больше возможностей по разрешению
Fast Черновики, быстрые тесты, подбор идеи, проверка нескольких вариантов Дешевле и быстрее, но не для максимального качества

Практическая схема: сначала делайте 2-3 быстрых теста в Fast, выбирайте лучший вариант композиции, потом запускайте финальную версию в Standard.

Формат, длительность, разрешение и звук

Перед генерацией важно выбрать технические настройки. Они сильно влияют на результат.

  • 9:16 — Reels, Shorts, TikTok, вертикальные клипы.
  • 16:9 — YouTube, лендинги, презентации, cinematic-сцены.
  • 1:1 — посты, обложки-анимации, универсальные соцсети.
  • 4-6 секунд — быстрый тест идеи.
  • 10-15 секунд — полноценная сцена с началом, развитием и финалом.
  • Generate audio — включайте, если важны звук, атмосфера, шумы, музыка или синхронизация.
  • Fixed lens — используйте, когда нужна спокойная статичная камера без лишнего движения.

Звук лучше описывать конкретно. Не «эпичная музыка», а «глухой бас, шум ночной улицы, ветер, далёкие машины, электронный пульс синхронно со свечением энергии».

Трендовые промпты на русском

1. Супергерой Sferoom над Москвой

Используй изображение 1 как точный референс персонажа Sferoom: сохрани костюм, цвета, логотип, лицо и пропорции. Вертикальное видео 9:16. 0-3 секунды: герой стоит на крыше старой московской многоэтажки, серое небо, антенны, мокрый бетон, внизу двор с Жигулями и Москвичами. 3-6 секунд: он прыгает с крыши и выпускает сине-фиолетовые энергетические нити в форме музыкальных волн. 6-9 секунд: камера сбоку следует за ним, он летит между домами над улицей с русскими вывесками, маршрутками и троллейбусными проводами. 9-12 секунд: финальный героический кадр над вечерней Москвой, энергия Sferoom пульсирует вокруг костюма, слышны ветер, город и электронный бас.

2. Тизер музыкального релиза

Вертикальное видео 9:16. Молодой артист идёт ночью по мокрой улице после дождя, в наушниках, задумчивый взгляд, в отражениях асфальта мигают фонари и вывески. Камера плавно следует сзади, затем переходит в боковой крупный план. На последнем кадре вокруг него появляются световые волны, будто музыка становится видимой. Атмосфера ночного клипа, реалистичный свет, мягкая плёночная текстура, приглушённый бас и шум города.

3. Оживление обложки трека

Используй изображение 1 как обложку трека и не меняй композицию. Камера медленно приближается к центру изображения, свет на фоне слегка пульсирует в ритм музыки, мелкие частицы двигаются в воздухе, элементы одежды и волосы едва заметно оживают. Сохрани лицо, цвета, стиль и общий дизайн обложки. Атмосфера музыкального сниппета, мягкий cinematic glow, без новых объектов и без искажения текста.

4. UGC-реклама продукта

Вертикальное видео 9:16. Молодой креатор на светлой кухне держит продукт ближе к камере, улыбается и быстро показывает три преимущества жестами. Камера выглядит как съёмка на телефон, лёгкое естественное дрожание, яркий дневной свет из окна, чистый фон. Продукт остаётся резким, этикетка читаемая, темп энергичный как в Reels, слышна лёгкая поп-музыка и короткие звуки жестов.

5. Fashion-видео в русском дворе

Модель в тёмном оверсайз-пальто уверенно идёт через старый московский двор между панельными домами. У бордюров снежная каша, рядом припаркованы Лады, на стенах граффити, в окнах тёплый жёлтый свет. Камера движется сбоку с той же скоростью, ткань пальто развивается на ветру. Атмосфера честного русского fashion-фильма, приглушённые зимние цвета, шаги по мокрому асфальту и далёкий шум города.

6. Мемный кот для Shorts

Вертикальное видео 9:16. Рыжий пушистый кот сидит на кухонной столешнице и подозрительно смотрит на стакан воды. 0-2 секунды: кот медленно поднимает лапу. 2-4 секунды: осторожно толкает стакан к краю. 4-6 секунд: стакан падает за кадр, кот смотрит прямо в камеру с невинным лицом. Яркий кухонный свет, ощущение съёмки на телефон, комедийная пауза, звук падения стакана и короткое мяу.

Чек-лист перед генерацией

  • Понятно ли, кто главный объект в кадре?
  • Есть ли одно главное действие?
  • Выбран ли формат: 9:16, 16:9 или 1:1?
  • Описано ли движение камеры?
  • Если есть референсы, назначена ли роль каждому?
  • Не конфликтуют ли инструкции между собой?
  • Нужен ли звук или можно сэкономить и оставить generate audio выключенным?
  • Для финала выбран Standard, а для тестов Fast?

Итог

Seedance 2 даёт сильные результаты, когда промпт написан как постановка сцены. В Sferoom можно писать по-русски: сервис помогает превратить обычную идею в структурированную инструкцию для модели, а кнопка «Улучшить» добавляет недостающие детали по камере, свету, движению и стилю.

Лучший рабочий процесс такой: сначала набросайте идею простыми словами, нажмите «Улучшить», проверьте структуру, сделайте короткий тест в Fast, затем финальную версию в Standard. Если важна внешность — используйте Image-to-Video. Если важны движение, музыка и референсы — выбирайте Omni Reference. Если нужно просто найти идею — начинайте с Text-to-Video.

Полезные источники: BytePlus ModelArk Seedance 2.0 tutorial, Dreamina Seedance 2.0 Guide, Dreamina Seedance 2.0 prompts, Seedance prompt guide, InVideo Seedance 2.0 guide.

Другие статьи

Плейлисты Яндекс Музыка: Пакет «Старт» — продвижение через 50 плейлистов

Что такое пакет «Старт»? Это размещение вашего трека в 50 пользовательских плейлистах Яндекс Музыки сроком на 1 месяц. Плейлисты рекомендуются сервисом, что даёт релевантный охват живой аудитории. Пакет «Старт» — отличный способ дать треку первоначальный буст и повысить шансы на попадание в алгоритмические рекомендации. Что входит в пакет? 🎵 50 плейлистов Яндекс Музыки 👥 Прогноз [...]

Нативное размещение релиза у блогеров — продвижение через вертикальный видеоконтент

Что такое нативное размещение у блогеров? Это продвижение вашего релиза через блогеров в формате вертикального видеоконтента. Мы подбираем подходящие площадки и закупаем размещения, где ваш трек органично вписывается в контент. Нативная реклама не выглядит как реклама — блогер использует ваш звук в своём видео, и аудитория воспринимает это естественно. Почему это работает? 🎯 Доверие аудитории [...]

sferoom