一、Step-Video-T2视频生成的核心技巧(资深视角)
1. 物理模拟参数优化
- 重力与材质调整:在
Physics Constraints
节点中,优先设置重力系数为地球标准值(9.8 m/s²),再根据场景微调。例如生成「火焰上升」效果时,需将重力设为负数(如-3.5)1。 - 刚体碰撞优化:启用
Collision Detection
节点,设置Iterations=5
(平衡精度与速度),避免视频中物体穿透1。
2. 时序控制技巧
- 关键帧跳跃生成:对于204帧长视频,可间隔16帧生成关键帧(第0/16/32...帧),再用
Frame Interpolator
补间,显存占用降低60%1。 - 动态FPS切换:在动作激烈片段(如打斗)设为30FPS,平缓场景(如风景)降为15FPS,提升生成效率3。
3. 多模态联动
- 音频同步:将
Step-Audio
生成的音轨通过Audio-Visual Sync
节点接入,自动校准口型与动作节奏(需开启唇形捕捉模型)1。 - 图片嵌入控制:在
Image Conditioning
节点插入参考图(如角色设定图),设置强度0.3-0.5保持风格统一6。
二、视频提示词与图片提示词的本质区别
1. 结构维度差异
类型 | 核心结构 | 典型案例 |
---|---|---|
图片提示词 | 空间描述为主:(主体)+(细节)+(风格) | 1girl, red dress, detailed face, cyberpunk 7 |
视频提示词 | 时空双维度:(主体)+(运动)+(时序) | [0-64帧]car accelerate on highway, [65-128帧]car drift on curve 1 |
2. 参数设计差异
- 动态权重标记:使用
[start-end:weight]
语法控制不同时间段提示词强度。
示例:[0-30:1.2]sunrise, [31-60:0.8]morning fog
(前30帧强调日出,后30帧弱化雾气)1。 - 物理动作描述:需明确动词时态(如
falling
而非fall
)、运动方向(from left to right
)4。
3. 特殊语法扩展
- 镜头运动指令:
zoom_in 2x at 15-30f
(15-30帧2倍放大)
pan_right 30deg/s
(每秒右移30度)1。 - 材质变化标记:
{metal→rust:0-60f}
(金属在60帧内渐变为锈蚀)3。
三、新手操作避坑指南
1. 显存管理技巧
- 分块渲染:在
Render Settings
启用Tile Rendering
,设置chunk_size=32
(每块32帧)3。 - 混合精度:将
Model Precision
设为fp16
(需显卡支持),显存占用减少40%3。
2. 提示词实用模板
# 基础模板
"[0-{total_frames}]main_subject, environment,
{keyframe_1}[{start}-{end}]action_detail,
{keyframe_2}[{start}-{end}]camera_movement"
# 实战案例(64帧跑步场景)
"[0-64]athlete_running, stadium_background,
[0-32]start_from_left, [33-64]move_to_center,
[48-64]zoom_in_face 1.5x"[1]()
3. 调试工具使用
- 运动轨迹预览:添加
Motion Vector Visualization
节点,实时显示物体运动路径1。 - 物理参数模拟:在
Physics Debug
节点中,用简化模型(如立方体)验证碰撞效果,再迁移到复杂场景3。
四、与图片生成工作流对比(操作层面)
操作环节 | 图片生成 | Step-Video-T2视频生成 |
---|---|---|
模型加载 | 单一Checkpoint模型加载3 | 需同时加载运动模型+物理引擎1 |
采样器设置 | 关注步数(20-30步)7 | 需设置时序扩散步数(通常8-12步)1 |
输出审查 | 单张图片视觉检查4 | 需逐帧检查+波形图比对6 |
后处理 | 局部重绘+超分3 | 帧插值+时间平滑滤波1 |
五、进阶学习路径建议
- 案例拆解:从CivitAI下载
.json
工作流文件(搜索"Step-Video-T2 example"),用文本编辑器分析节点连接逻辑3。 - 参数实验:固定其他参数,每次仅调整一个物理变量(如摩擦系数),记录输出变化规律1。
- 硬件升级:建议配备至少24GB显存显卡(如RTX 4090)+ 64GB内存,以支持长时序生成3
ComfyUI视频提示词语法详解(基于搜索结果与工作流特性分析)
建议结合ComfyUI Manager安装Video Prompt Helper
插件实现语法高亮和实时校验6。
一、基础语法规则(通用图片/视频共性)
- 多语言混合支持
- 权重控制语法
- 逻辑关系标记
二、视频专属语法(时序与物理特性)
- 时序控制语法
- 帧间隔触发:
{关键词|帧间隔}
,例如{spark|10}
每10帧生成一次火花。 - 关键帧标记:
<<关键帧描述>>
定义镜头切换点(如<<镜头切换: 推镜头>>
)。
- 帧间隔触发:
- 物理参数嵌入
- 刚体动力学:
#刚体(质量=2kg, 弹性=0.7)
定义物体物理属性。 - 流体模拟:
#流体(粘度=0.3, 湍流=on)
控制液体/气体行为。
- 刚体动力学:
- 镜头运动语法
- 轨迹方程:
$camera(x(t)=t^2, y(t)=sin(t))
用数学公式定义摄像机路径。 - 运镜缩写:
ZOOM IN 2x
快速设置2倍缩放,PAN LEFT
定义水平移动。
- 轨迹方程:
三、高级语法技巧
-
元素生命周期控制
(raindrop:1.3) [生命周期: 起始帧=20, 持续时间=30, 渐隐=5]
表示雨滴从第20帧出现,持续30帧,最后5帧渐隐。
-
条件触发语法
IF (frame > 100) THEN (add fire)
当视频超过100帧时自动添加火焰元素。
-
物理事件响应
ON COLLISION (ball, ground) GENERATE (dust)
设置球体碰撞地面时生成灰尘粒子。
四、与图片提示词的核心差异
维度 | 图片提示词 | 视频提示词 |
---|---|---|
时间轴控制 | 无时序概念 | 需定义帧级变化(权重/元素/镜头) |
物理参数 | 仅描述视觉属性 | 需嵌入质量/弹性/流体粘度等物理量 |
资源占用 | 单帧渲染 | 需预计算时空连续性(显存优化语法) |
调试方式 | 静态预览 | 需时间轴逐帧检查3 |
五、操作建议
- 物理参数调试流程
- 先用
#刚体(质量=1kg)
简单参数生成预览 - 通过
PHYSICS_DEBUG
节点查看运动轨迹 - 逐步增加复杂度(如添加空气阻力参数)
- 先用
- 显存优化策略
- 长视频使用
TILE_RENDER
分块语法:#tile(分段数=4, 重叠帧=8)
- 启用
--lowvram
模式运行ComfyUI
- 长视频使用
- 工作流保存规范
- 为每个视频项目单独保存
.json
文件 - 在元数据中记录物理参数版本(如
physics_engine=v2.1
)
- 为每个视频项目单独保存
附:典型视频提示词案例
1. 主体镜头:
"#刚体(质量=5kg, 弹性=0.6) 玻璃瓶破碎,
$camera(x(t)=cos(t), y(t)=t^2) ZOOM OUT 1.5x"
2. 环境特效:
"(sparks:1.3) [生命周期: 起始帧=15, 渐隐=10],
#流体(粘度=0.4) 烟雾扩散 NOT (fire)"
3. 动态事件:
"IF (frame > 120) THEN (add #刚体(质量=2kg) 石头坠落)"