过去两周视频模型圈炸了！WAN 2.1、Hunyuan Image to Video、LTXV三巨头齐发，干货满满快接住！

前字节AI绘画师

于 2025-03-12 14:30:00 发布

阅读量999

点赞数 23

分类专栏： AIGC Comfyui教程 AI视频文章标签：音视频人工智能 ComfyUI AI绘画 AI作画 comfyui工作流模型

本文链接：https://blog.csdn.net/m0_71745754/article/details/146197830

版权

Comfyui教程同时被 3 个专栏收录

277 篇文章

订阅专栏

AIGC

276 篇文章

订阅专栏

AI视频

4 篇文章

订阅专栏

最近两周，AI视频模型圈简直是炸开了锅，三款重磅模型接连亮相：WAN 2.1、Hunyuan Image to Video 和 LTXV，直接把视频生成的技术天花板又往上顶了一截。作为一个深度关注AI创作的“老司机”，我今天就带大家扒一扒这三款模型的最新动态，聊聊它们的更新亮点、使用技巧和隐藏福利，保证干货满满，逻辑清晰，让你看完直呼“值了”！

一、WAN 2.1：fp16推理逆袭，显存不够也能玩转大模型

先说WAN 2.1，这个模型最近的更新可以用“低调奢华有内涵”来形容。最炸裂的消息是：团队发现它在fp16（16位浮点数）推理时的表现居然比bf16（脑浮点16）还要强！这简直是“技术宅的自我修养”啊，要知道之前大家用bf16跑模型的时候，总觉得差点意思，现在换成fp16，画质直接起飞，细节拉满，接近全精度fp32的计算效果，连我这种挑剔党都忍不住点赞。

具体来说，小型1.3亿参数（1.3B）模型在fp16下的提升尤为明显，连肉眼都能看出差别。而对于14亿参数（14B）的大模型，改进也很可观，细节渲染和动态流畅度都上了新台阶。如果你还在用bf16的老版本，赶紧升级吧，别犹豫，fp16就是新王道！

当然，显存不够的小伙伴也别慌，WAN团队贴心地上传了fp8_scaled版本的权重。相比常规fp8，这个版本速度会稍慢一点，但质量绝对有保障，堪称“低配显卡的救星”。

想体验新工作流程，直接戳官网示例页面https://comfyanonymous.github.io/ComfyUI_examples/wan/

下载链接和教程一应俱全，动手能力强的朋友还能自己调参玩出花来。

硬核Tips：如果你是新手，建议从小模型入手，1.3B够轻量，跑起来不卡顿；要是追求极致效果，14B+fp16组合了解一下，显存16G以上的玩家直接无脑冲！

二、Hunyuan Image to Video v2：一天一个新版本，图像引导更精准

再来说说Hunyuan Image to Video，这个模型简直是“加班狂魔”的代表。首发当天刚让大家惊呼“图像转视频的天花板来了”，第二天团队就甩出v2“修复版”，速度快得让人怀疑他们是不是没睡觉。这次更新可不是简单的bug修复，而是直接上了个架构微调的新模型，堪称“换了个马甲再战江湖”。

新v2被戏称为“replace”模型，对比v1的“concat”模型，它在跟随引导图像上的表现更胜一筹。简单来说，v2更像个“听话的乖宝宝”，生成的视频和初始图像贴合度更高，细节还原能力拉满；而v1则像个“自由派艺术家”，运动感和动态衔接更流畅，适合喜欢创意发挥的朋友。两者各有千秋，具体选哪个，看你需求咯——想要精准还原选v2，追求丝滑动感选v1。

官网示例页面

https://comfyanonymous.github.io/ComfyUI_examples/hunyuan_video/

已经更新了两种模型的工作流程，懒人直接照着抄作业就行。我试着跑了几个demo，发现v2在处理复杂背景的静态图像时特别稳，生成的视频几乎看不出违和感；而v1更适合快速切换的场景，动作连贯性强到飞起。建议大家两手抓，两手都要硬，反正免费资源不玩白不玩！

硬核Tips：跑Hunyuan模型时，初始图像的质量很重要，建议用高分辨率输入，细节越丰富，生成效果越炸裂。另外，帧率参数别调太高，24-30帧就够用了，不然显存吃不消。

三、LTXV 0.9.5：轻量级“快枪手”，效率党的最爱

最后压轴出场的是LTXV 0.9.5，这个模型简直是“效率党”的福音。如果你觉得WAN和Hunyuan跑起来太慢，显卡直冒烟，那LTXV绝对能救你于水火。上周刚发布时，我就被它的速度惊艳到——轻量级架构，推理快如闪电，连我这台老古董3060都能流畅跑完一个短视频。

LTXV 0.9.5的工作流程也已经在官网更新，上手难度几乎为零，随手扔张图进去，调几个参数，几分钟就能出片。虽然它不像WAN或Hunyuan那样参数量惊人，但胜在效率高、门槛低，特别适合快速验证创意或者做短平快的项目。

官网展示：https://comfyanonymous.github.io/ComfyUI_examples/ltxv/

值得一提的是，LTXV的社区反馈很积极，不少用户表示它在处理简单动画和循环视频时表现尤为出色。如果你是个“拖延症患者”，或者单纯想省点电费，LTXV绝对是你的菜。

硬核Tips：LTXV对输入图像的依赖度不高，随手画个草图都能生成效果不错的视频。不过想提升质量，可以试试加个预处理节点，把图像边缘锐化一下，出片更清晰。

四、彩蛋福利：SaveWEBM节点升级，视频创作更丝滑

除了三大模型的更新，还有个小彩蛋不得不提——核心SaveWEBM节点迎来了一次“体验优化”。现在这个节点不仅能保存WebM格式的视频，还能在节点上直接预览生成内容，前端甚至支持从保存的WebM文件加载工作流程。这是什么概念？简单说，就是你以后调试视频时不用满世界找文件，直接在界面上点一点就能回看、调整，效率直接翻倍！

这个功能对于喜欢反复迭代的朋友来说简直是神器，尤其是做长视频或者需要频繁改动的项目，省下的时间够你多喝几杯咖啡了。

五、总结与展望：AI视频创作的下半场才刚开始

看完这三款模型的更新，你是不是也和我一样热血沸腾？这波技术迭代不仅带来了更高的画质、更快的速度，还贴心地照顾到了不同硬件水平和创作需求的用户。WAN 2.1的fp16逆袭让人看到了精度与效率的平衡之道；Hunyuan Image to Video的v1v2双雄并立提供了更多创作可能性；而LTXV 0.9.5则用轻量化设计降低了入坑门槛。再加上SaveWEBM的体验升级，AI视频创作的生态正在变得越来越完善。

未来呢？我大胆预测，随着模型参数量继续优化和硬件支持的提升，AI视频生成可能会迎来“全民创作”时代。不管你是专业剪辑师还是随便玩玩的“小白”，总有一款工具能让你随手拍出大片感。到时候，朋友圈、短视频平台可能全是AI生成的内容，你准备好了吗？

最后奉上三句话箴言：想画质选WAN，想精准选Hunyuan，想速度选LTXV。赶紧去官网（链接文中有）下载新版本试试吧，别等凉了再后悔！有什么问题或者跑模型的心得，欢迎留言，咱们一起卷起来！

为了帮助大家更好地掌握 ComfyUI，我花了几个月的时间，撰写并录制了一套ComfyUI的基础教程，共六篇。这套教程详细介绍了选择ComfyUI的理由、其优缺点、下载安装方法、模型与插件的安装、工作流节点和底层逻辑详解、遮罩修改重绘/Inpenting模块以及SDXL工作流手把手搭建。