【AI数字人】AniPortrait音频驱动图片数字人本地离线整合包

4 篇文章 0 订阅

今天分享的项目是由华为和腾讯的研究人员联手开发的AniPortrait,只需一段音频和一个静态的肖像图像,就能生成一段数字人视频。支持音频生成视频、视频生成视频。我已经将项目打包,离线解压即可使用!(整合包在文章末尾自取)

配置要求

WIN

  • Windwos10/11操作系统
  • 16G显存以上的英伟达显卡
  • 如果出现cuda错误,建议安装cuda11.7或以上版本

MAC

暂不支持本地离线版本

可访问在线链接进行体验(需科学上网)

https://huggingface.co/spaces/ZJYang/AniPortrait_official

使用方法

音频生视频

  1. 将音频文件上传到指定位置

  1. 接着上传希望动画化的图片

  1. 上传一个头部姿势参考视频,这个视频将作为生成视频的人物动作姿态的参考依据。(这是一个可选选项)

  1. 默认的视频尺寸为512×512像素。根据自身情况进行调节。

  1. 视频长度,默认为60,建议设定为0。根据音频计算生成长度。

  1. 步数,默认25。即模型处理图像的迭代次数。步数越高,生成的视频画面将越精细,但同时对计算资源的需求也越大。

  1. 种子值可以保持不变。

视频生视频

操作方法跟音频生视频类似,上传源视频即可。

需要注意的是,这个项目是有示例的,点击示例会自动配置示例的音频和图片,但是生成示例会很慢!建议用自己的图和音频先试下!

常见问题

这个项目使用时可能会遇到UTF-8编码问题。

解决方法:

打开控制面板---时钟和区域

点击区域

点击管理

点击更改系统区域设置

勾选这个选项,然后重启电脑即可。

技术实现

  • 利用wav2vec2.0作为Audio2Lmk阶段的基础模型。
  • 为了提高网络对唇部运动的敏感性,在渲染姿态图像时,将上下唇用不同的颜色区分开来。
  • 所有图像被调整至512x512的分辨率进行训练。

  1. 音频到面部标记(Audio2Lmk)
    • 使用预训练的wav2vec模型从音频中提取特征,这些特征能够准确识别发音和语调。
    • 通过两个全连接层(fc layers),将音频特征转换为3D面部网格。
    • 利用transformer解码器,结合交叉注意力机制,预测头部姿态序列。
  1. 面部标记到视频(Lmk2Video)
    • 给定参考肖像图像和面部标记序列,Lmk2Video模块创建与标记序列对齐且外观与参考图像一致的时间一致性肖像动画。
    • 网络结构设计灵感来源于AnimateAnyone,使用Stable Diffusion 1.5作为基础,整合了时间运动模块。

整合包获取

👇🏻👇🏻👇🏻什么?是不是收费的?👇🏻👇🏻👇🏻

关注公众号,发送【AniPortrait】关键字获取整合包。

如果发了关键词没回复你!记得看下复制的时候是不是把空格给粘贴进去了!

如果本文对您有帮助,还请点个免费的赞或在看!感谢您的阅读!

  • 21
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 4
    评论
AI数字人视频素材完整库 "PAN" 是一个集成了各种类型和风格的数字人视频素材的全面数据库。它被设计为一个方便、高品质的资源,可以满足不同行业和领域对数字人视频素材的需求。 "PAN" 数据库中的素材含多种不同类型的数字人,括真实人像、卡通人物和科幻角色等。这些数字人都是由先进的人工智能技术生成的,具有高度逼真的外貌和动作表现能力。无论是需要一个符合真实场景的现实人像,还是一个可爱的卡通角色,"PAN" 都可以提供多样化的选择。 "PAN" 数据库中的素材涵盖了各种风格和主题,适用于不同的视觉效果和创意需求。无论是需要创作一个科幻冒险故事,还是一个动画片的角色设计,都可以在"PAN" 中找到适合的素材。同时,"PAN" 还提供了丰富的动作和表情选项,可以满足不同的角色行为和情感表达需求。 "PAN" 提供了方便的搜索和筛选功能,用户可以根据关键词、类型、风格和主题等进行快速定位和筛选。同时,用户还可以根据具体需求对素材进行定制和修改,以获得更符合自己创意的效果。 总之,AI数字人视频素材完整库"PAN"是一个全面、方便、高品质的数字人视频素材数据库,可以满足各种行业和领域对数字人视频素材的需求。无论是创作影视作品、广告宣传还是动画设计,使用"PAN"可以节省时间和资源,同时保证作品的质量和效果。
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值