AI算法让图片动起来,特朗普和蒙娜丽莎深情合唱《Unravel》_unravel 动脸

通过一阶运动模型,将静态图片动起来,本文介绍如何使用该技术让特朗普和蒙娜丽莎合唱《Unravel》。涉及算法原理、环境搭建和效果实现,包括关键点检测、运动估计和图像生成。使用Python相关库和预训练模型,借助ffmpeg处理音频和视频,实现图像动画效果。
摘要由CSDN通过智能技术生成

点赞再看,养成习惯,微信公众号搜索【JackCui-AI】关注这个爱发技术干货的程序员。本文 GitHub https://github.com/Jack-Cherish/PythonPark 已收录,有一线大厂面试完整考点、资料以及我的系列文章。

一、前言

让一张图片,动起来,应该怎么做?

DeepFake 一阶运动模型,让万物皆可动。

利用这项技术,用特朗普蒙娜丽莎的图片,合唱一首《Unravel》,是什么效果?

今天,它来了!

让图片动起来,特朗普和蒙娜丽莎深情合唱《Unravel》

今天,继续手把手教学

算法原理、环境搭建、效果实现,一条龙服务,尽在下文!

下文提到的代码权重文件视频图片素材我都已经打包好了拿来直接用也可以

下载链接(密码:tl0h):https://pan.baidu.com/s/1OEfsXWAN4RPO9vwbCTXIMA

更多有趣算法都放在了 Github,超多干货:

https://github.com/Jack-Cherish/PythonPark

二、算法原理

First Order Motion,也就是一阶运动模型,来自 NeurIPS 2019 论文。

「First Order Motion Model for Image Animation」

论文最初的目的是让「静态图片」动起来。如下图所示:“你动,它也动”。

让图片动起来,特朗普和蒙娜丽莎深情合唱《Unravel》

这个模型可以轻易地让「权利的游戏」中的人物模仿特朗普进行讲话,还可以让静态的马跑起来等。

让图片动起来,特朗普和蒙娜丽莎深情合唱《Unravel》

让图片动起来,特朗普和蒙娜丽莎深情合唱《Unravel》

一阶运动模型的思想是用一组自学习的关键点和局部仿射变换来建立复杂运动模型。

模型由运动估计模块和图像生成模块两个主要部分组成。

让图片动起来,特朗普和蒙娜丽莎深情合唱《Unravel》

首先进行关键点检测,然后根据关键点,进行运动估计,最后使用图像生成模块,生成最终效果。

在运动估计模块中,该模型通过自监督学习将目标物体的外观和运动信息进行分离,并进行特征表示。

而在图像生成模块中,模型会对目标运动期间出现的遮挡进行建模,然后从给定的图片中提取外观信息,结合先前获得的特征表示,生成图片。

作者使用该算法在四个数据集上进行了训练和测试。

VoxCeleb 数据集、UvA-Nemo 数据集、The BAIR robot pushing dataset、作者自己收集的数据集。

其中,VoxCeleb 是一个大型人声识别数据集。

它包含来自 YouTube 视频的 1251 位名人的约 10 万段语音,同时数据基本上是性别平衡

  • 17
    点赞
  • 21
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值