EchoMimic:蚂蚁开源逼真数字人框架,表情口型更生动自然,本地部署包获取

EchoMimic:逼真的音频驱动人像动画

EchoMimic简介

近日蚂蚁开源了一款名为:EchoMimic 数字人的框架。EchoMimic能够通过单独的音频文件和一张静态面部标志点的图像生成数字人像视频,也可以通过音频和选定的面部标志点的组合来生成。

由音频输入推动的人像图像动画领域,在生成逼真和动态的人像方面取得了显著进展。传统方法仅限于使用音频或面部关键点来驱动图像转视频,虽然可以获得满意的结果,但存在一些问题。例如,仅由音频驱动的方法有时会因为音频信号相对较弱而不稳定;而完全由面部关键点驱动的方法,尽管在驱动上更稳定,但可能会因为关键点信息的过度控制而导致结果不自然。为了应对前述挑战,研究团队介绍了一种名为EchoMimic的新方法。EchoMimic同时使用音频和面部标志点进行训练。通过实施一种新颖的训练策略,EchoMimic不仅能够单独通过音频和面部标志点生成人像视频,还能够通过音频和选定的面部标志点的组合来生成。EchoMimic已经在多个公共数据集和收集的数据集上与替代算法进行了全面比较,在定量和定性评估中展现出更优越的性能。

  • • Github地址:https://github.com/BadToBest/EchoMimic

  • • 项目主页:https://badtobest.github.io/echomimic.html

官方视觉演示案例

更多演示案例,请参见官方主页:https://badtobest.github.io/echomimic.html 。

EchoMimic使用指南

当前官方给出的代码库中,只包含CLI命令行运行方式。考虑到方便大家的使用,笔者已创建了WebUI版本,欢迎大家提供更多建议。

  • • 代码地址:https://github.com/greengerong/EchoMimic/tree/main

同时笔者也提供了国内网盘包,文末已放置网盘下载口令

运行命令:安装依赖并启动服务

# window 双击运行该批处理文件,或在命令提示符中导航到文件所在目录并运行 run.bat  
./run.bat  
  
# Linux 在终端中运行如下命令  
chmod +x run.sh && ./run.sh。

仅运行:也可使用仅启动服务,使用已有环境依赖,不独立安装依赖

# 服务启动  
python -u app.py

如果遇见touch问题,确保正在上网重新安装:

pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121 -U

WebUI界面

EchoMimic体验

本文中使用的是可图(Kolors) 生成输入图像,避免肖像隐私。

  • Kolors模型地址(国内哩布镜像):https://www.liblib.art/modelinfo/c10a365bbdff40edb3f18b9fdfb694f8

  • Kolors模型地址(huggingface):https://huggingface.co/Kwai-Kolors/Kolors/tree/main

  • 在线绘图地址:https://klingai.kuaishou.com/

Kolors示例

这位身着天蓝色和银色服装的美丽女子,她的黑色虹膜看起来就像中国神话中的年兽。这张照片是用手机相机在TikTok上拍摄的,可以看到她美丽的眼睛。她有金色的刘海,似乎化了妆,脸上有美丽的金色图案。她皮肤上的纹路也清晰可见。逼真的风格,全身外观,丰富的背景,4k超高清

EchoMimic体验

在WebUI界面中,仅需按照界面指引操作上传一张人物图片和一段音频文件,点击生成,耐心等待任务执行完成,即可看见输出视频效果。默认保存在本地文件目录**/EchoMimic/output/tmp** 下。每次会生成两个视频,一个为无声视频和一个配音视频。

注:在测试体验经验,输入图像需要保持1:1,同时保证高清质量和人物脸部可识别脸部不要有复杂遮挡物,否则会无法识别报错。

写在最后

感兴趣的小伙伴,赠送全套AIGC学习资料,包含AI绘画、AI人工智能等前沿科技教程和软件工具,具体看这里。
在这里插入图片描述

AIGC技术的未来发展前景广阔,随着人工智能技术的不断发展,AIGC技术也将不断提高。未来,AIGC技术将在游戏和计算领域得到更广泛的应用,使游戏和计算系统具有更高效、更智能、更灵活的特性。同时,AIGC技术也将与人工智能技术紧密结合,在更多的领域得到广泛应用,对程序员来说影响至关重要。未来,AIGC技术将继续得到提高,同时也将与人工智能技术紧密结合,在更多的领域得到广泛应用。

在这里插入图片描述

一、AIGC所有方向的学习路线

AIGC所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照下面的知识点去找对应的学习资源,保证自己学得较为全面。

在这里插入图片描述

在这里插入图片描述

二、AIGC必备工具

工具都帮大家整理好了,安装就可直接上手!
在这里插入图片描述

三、最新AIGC学习笔记

当我学到一定基础,有自己的理解能力的时候,会去阅读一些前辈整理的书籍或者手写的笔记资料,这些笔记详细记载了他们对一些技术点的理解,这些理解是比较独到,可以学到不一样的思路。
在这里插入图片描述
在这里插入图片描述

四、AIGC视频教程合集

观看全面零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。

在这里插入图片描述

五、实战案例

纸上得来终觉浅,要学会跟着视频一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
在这里插入图片描述
在这里插入图片描述

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值