PaddleGAN快速让你的照片动起来

最新推荐文章于 2025-06-05 09:09:04 发布

原创

最新推荐文章于 2025-06-05 09:09:04 发布 · 1.6k 阅读

26 ·

CC 4.0 BY-SA版权

文章标签：

#paddlepaddle #动画

本文介绍了如何利用PaddleGAN的FirstOrder和Wav2lip技术，将静态照片转化为动态视频，通过输入模板视频和音频，实现照片人物的动作和语音同步。详细步骤包括下载代码、迁移驱动视频至照片、添加音乐以及使用Wav2lip进行唇形合成。

一个不知名大学生，江湖人称菜狗
original author: Jacky Li
Email : 3435673055@qq.com

Time of completion：2024.03.30
Last edited: 2024.03.30

PaddleGAN快速让你的照片动起来

本项目基于PaddleGAN实现的FirstOrder与Wav2lip,。FirstOrder是输入一个模板视频与一张照片，就可以使照片里面的人物唱出模板视频里的歌曲，前段时间很火的「蚂蚁呀嘿」就是用这个方法做的；还有另一个方法就是使用Wav2lip，输入照片和音频就可以直接让照片根据音频的内容动起来。

两个方案让照片动起来

方案一：FirstOrder

下载PaddleGAN代码

git clone https://gitee.com/paddlepaddle/PaddleGAN

# 安装所需安装包%cd PaddleGAN/ !pip install -r requirements.txt !pip install imageio-ffmpeg %cd applications/

2.将驱动视频迁移至照片中

大家可以上传自己准备的视频和图片，并在下面的代码中source_image参数和driving_video参数分别换成自己的图片和视频路径，然后点击运行，就可以完成动作表情迁移，程序运行成功后，会在ouput文件夹生成名为result.mp4的视频文件，该文件即为动作迁移后的视频。

本项目中提供了原始图片和驱动视频供展示使用。具体的各参数使用说明如下

driving_video: 驱动视频，视频中人物的表情动作作为待迁移的对象
source_image: 原始图片，视频中人物的表情动作将迁移到该原始图片中的人物上
relative: 指示程序中使用视频和图片中人物关键点的相对坐标还是绝对坐标，建议使用相对坐标，若使用绝对坐标，会导致迁移后人物扭曲变形
adapt_scale: 根据关键点凸包自适应运动尺度
output：设置输出视频的存放文件夹

!export PYTHONPATH=$PYTHONPATH:/home/aistudio/PaddleGAN && python -u tools/first-order-demo.py --driving_video /home/aistudio/PlanA_FirstOrder/zhiming.mp4 \