OmniVideo 参考图控制指南:让图生视频更稳定

2026/04/05

参考图不是生成前随手上传的素材。在 OmniVideo 里,它是这条动态草稿的视觉约定:人物、产品、logo、版式或情绪,都应该被运动保护下来。

图生视频失败时,问题往往不是提示词太短,而是源画面、动作请求和审核标准各自承担了不同任务。

相关阅读:

先写清视觉约定

生成前先说明什么必须保持可识别。人物可能是脸型、发型、服装、姿态和表情范围;产品可能是轮廓、标签位置、材质、核心细节和比例;版式可能是主要构图和层级。

把这个约定写得具体一些。好的动态草稿可以运动,但不应该悄悄替换掉你已经确认的视觉资产。

只选一个主锚点

用最干净的图片做主参考。它应该有明确主体、清楚边缘、稳定光线,并且主体周围留有一定空间。画面过度裁切或已经变形时,模型更难保护关键细节。

额外参考图只有在彼此一致时才有帮助。如果一张是正脸,另一张又是不同发型,模型可能在冲突中折中,导致漂移。

给动作设置预算

动作预算指你要求画面承受多少变化。缓慢推进、轻微转头、产品小幅旋转或光线变化,是小预算。跑动、旋转、环绕镜头、服装大幅摆动、新背景动作和夸张表情同时出现,就是大预算。

先从小预算开始。如果第一版能保持身份,再在下一次测试里增加运动。

稳定动态提示词结构

使用上传图片作为视觉锚点。保持 [脸部/产品/logo/版式细节]。只添加一个克制动作:[动作]。镜头:[镜头行为]。保持 [关键细节] 稳定。审核重点:运动后主体是否仍然可识别?

这个结构让源画面负责视觉身份,也让审核标准变得明确。

分轮审核

不要一次性评价整条片段。可以分几轮看:

  1. 身份轮:脸、产品形状、logo、服装或版式。
  2. 动作轮:请求的动作是否清楚发生。
  3. 背景轮:环境是否保持连贯。
  4. 渠道轮:画幅是否仍适合目标位置。

如果身份失败,先减少动作,不要急着改风格。如果身份稳定但动作不对,再修订动作或镜头说明。

最后建议

稳定的图生视频本质上是控制问题。OmniVideo 最适合的用法,是让源画面有明确任务,让提示词只给一个动作指令,再审核已确认视觉是否经得住运动。

OmniVideo Team

OmniVideo Team

OmniVideo 参考图控制指南:让图生视频更稳定 | OmniVideo | 产品动态 AI 视频生成器