万相2.1本地部署教程——阿里开源超强AI视频模型:物理模拟×中英双驱,定义AI生成新标杆!

一、介绍

通义万相 2.1(Wan2.1)是阿里推出的开源视频生成模型,于今年1月发布,凭借在复杂运动生成、物理规律模拟及多语言支持上的突破,成为AI视频生成领域的标杆,甚至超越某些闭源模型。在开源6天后,就登顶全球最大开源社区 Hugging Face 模型热榜与模型空间榜。

通义万相2.1采用自研的高效变分自编码器(VAE)和扩散时间变换器(DiT)架构,通过时空全注意机制增强时空上下文建模能力。其视频编解码方案将视频拆分为若干块(Chunk),缓存中间特征,实现显存消耗与视频长度无关,支持无限长1080P视频生成。

模型能够精准模拟碰撞、反弹、切割等物理现象,并在花样滑冰、游泳等复杂肢体运动中保持动作协调性,避免肢体扭曲,提升视频真实感。

同时,首次支持中文文字生成功能,可结合艺术字特效生成视频,填补了中文视频生成工具的空白。

图片

二、容器构建说明

1. 部署ComfyUI

(1)使用命令克隆ComfyUI
git clone https://github.com/comfyanonymous/ComfyUI.git
cd ComfyUI

(2)安装 conda(如已安装则跳过)

下面需要使用 Anaconda 或 Mimiconda 创建虚拟环境,可以输入 conda --version 进行检。下面是 Mimiconda 的安装过程:

  • 下载 Miniconda 安装脚本
wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh

  • 运行安装脚本
bash Miniconda3-latest-Linux-x86_64.sh

  • 遵循安装提示并初始化

按 Enter 键查看许可证条款,阅读完毕后输入 yes 接受条款,安装完成后,脚本会询问是否初始化 Conda 环境,输入 yes 并按 Enter 键。

  • 运行 source ~/.bashrc 命令激活 Conda 环境
  • 再次输入 conda --version 命令来验证时候安装成功,如果出现类似 conda 4.10.3 这样的输出就成功了。
(3)创建虚拟环境

输入下面命令:

conda create -n comfyui
conda activate comfyui

(4)安装pytorch
pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu121

(5)安装项目依赖:
pip install -r requirements.txt

此时所需环境就已经搭建完成,通过下面命令进行启动:

python main.py

访问网址得到类似下图界面即表示成功:

1727063772952_419bea3e_14633769.png

2. 下载模型

(1)如:下载模型wan2.1

访问 Hugging Face 搜索“Wan_2.1_ComfyUI_repackaged”下载相关模型。首次访问该页面时,可能需要同意用户协议才能看到模型下载页。
模型:

1743659953545_image.png

(2)工作流

1743660038268_image.png

1743660067559_image.png

重新启动模型导入工作流即可开始comfyui探索之旅。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值