AniTalker本地部署教程 ——从单张肖像到动态对话，重新定义虚拟交互！

算家计算

于 2025-03-07 16:01:25 发布

阅读量544

点赞数 4

分类专栏：模型构建文章标签：算家云应用社区模型部署算力租赁 AniTalker 数字人视频生成

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sjjs_1/article/details/146098050

版权

模型构建专栏收录该内容

167 篇文章

订阅专栏

一、模型介绍

AniTalker 由上海交通大学 X-LANCE 实验室与思必驰 AI Speech 联合开发，能够将静态肖像照片转化为动态的数字化身，并根据语音指令生成自然流畅的交谈和表情变化。这一功能突破了传统数字人技术受限于预设动作模板的局限，使得生成的动画效果更加逼真和吸引人。

1737782268293_微信截图_20250125131405.png

技术核心：自监督学习与动态解耦

身份与运动解耦技术：通过分离身份编码器与运动编码器，确保面部动态（如表情、头部动作）与人物身份无关，避免生成动画时出现身份信息干扰。
自监督学习策略：利用视频帧重建与互信息最小化，从无标注数据中学习通用运动表示，显著降低对标记数据的依赖1519。
多模态控制：支持音频驱动（Hubert或MFCC特征）、头部姿态参数（偏航、俯仰、翻滚角）及面部位置/缩放比例控制，实现高度可控的生成效果。

同时，AniTalker 还具有以下功能亮点：

口型同步与表情捕捉：不仅实现精准唇形匹配，还能生成眨眼、微笑等非言语微表情，增强真实感。
长视频支持：可生成超过3分钟的连续动画，适用于虚拟主播、教育培训等场景。
多语言适配：虽以英语训练为主，但通过扩展中文Hubert模型，已支持中文语音驱动。

二、部署流程

环境推荐配置

系统：Ubuntu22.04，

显卡：4090，

显存：24G，cuda11.8
(在部署完成进行对话时一张卡回答得很慢，建议使用两张)

1. 基础环境

查看系统是否有Miniconda3的虚拟环境

conda -V

如果输入命令没有显示Conda版本号，则需要安装。

2.更新系统命令

输入下列命令将系统更新及系统下载

apt-get update && apt-get install ffmpeg libsm6 libxext6  -y

3.创建虚拟环境

创建名称为“AniTalker”的虚拟环境并激活

conda create -n anitalker python==3.9.0 -y
conda activate anitalker

1737777126570_微信截图_20250118133917.png

1737777132135_微信截图_20250118133930.png

4.下载模型

输入下列命令下载AniTalker模型同时进入项目中

git clone https://gitclone.com/github.com/X-LANCE/AniTalker.git
cd AniTalker

1737777220962_微信截图_20250118143358.png

5.下载模型依赖包

输入下列命令：

pip install -r requirements.txt

建议使用这行命令，提升下载速度：

pip install -r requirements.txt  -i https://pypi.tuna.tsinghua.edu.cn/simple

直到“Successfully”出现，下载才结束：

三、网页演示

在本地运行graio应用程序，使用下列命令运行项目呈现模型的成功界面

python ./code/webgui.py

1737777341197_微信截图_20250121161547.png

博客等级

码龄1年

算家云官方账号

310
原创

4588
点赞

4347
收藏

2544
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

最新评论

低成本使用满血版DeepSeek R1！基于KTransformer框架的DeepSeek R1 671B本地部署教程
readfor: kt 能让 L20 48G *8能运行Q8？
MinerU容器构建教程
你浩先生: 能不能识别图像？
纯净无噪，智见未来——MAGI-1本地部署教程，自回归重塑数据本质
算家计算: 报错原因是因为save_preset 函数预期接收 2 个参数，但实际接收到了 7 个参数。可以让他更改app.py里面的程序，如下 # 保存预设 def save_preset(name, num_frames, video_size_h, video_size_w, num_steps, window_size, fps): params = [ num_frames, video_size_h, video_size_w, num_steps, window_size, fps ] preset_path = os.path.join(PRESETS_DIR, f"{name}.json") with open(preset_path, "w") as f: json.dump(params, f) return f"预设 {name} 保存成功！"
纯净无噪，智见未来——MAGI-1本地部署教程，自回归重塑数据本质
@小江不emo: 出错了，未找到原因： [code=python] /usr/local/lib/python3.10/dist-packages/gradio/utils.py:1018: UserWarning: Expected 2 arguments for function <function save_preset at 0x7ff6b03cb910>, received 7. warnings.warn( /usr/local/lib/python3.10/dist-packages/gradio/utils.py:1026: UserWarning: Expected maximum 2 arguments for function <function save_preset at 0x7ff6b03cb910>, received 7. warnings.warn( * Running on local URL: http://0.0.0.0:8080 To create a public link, set `share=True` in `launch()`. Traceback (most recent call last): File "/usr/local/lib/python3.10/dist-packages/gradio/queueing.py", line 625, in process_events response = await route_utils.call_process_api( File "/usr/local/lib/python3.10/dist-packages/gradio/route_utils.py", line 322, in call_process_api output = await app.get_blocks().process_api( File "/usr/local/lib/python3.10/dist-packages/gradio/blocks.py", line 2136, in process_api result = await self.call_function( File "/usr/local/lib/python3 [/code]
RAGFlow本地部署教程：多模态检索+动态生成，用AI重构企业知识生产力
算家计算: 原因可能是开发服务器限制。 Flask、Django 等框架自带的开发服务器（如 Werkzeug）性能低、不支持并发请求，且缺乏生产级安全防护。解决方法： 1.安装 WSGI 服务器 pip install gunicorn 2.修改启动命令使用 WSGI 服务器启动应用，而非直接运行 python app.py。假设你的 Ragflow 应用入口文件是 app.py，且应用实例名为 app，则启动命令为： gunicorn --workers 4 --bind 0.0.0.0:5000 app:app --workers: 进程数（建议设为 CPU核心数*2 + 1） --bind: 绑定地址和端口 app:app: 冒号前为文件名（不含 .py），后为应用实例名。您可以试试这个方法哦

大家在看

最新文章

2025

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。