Model-Swap-Face
Github地址:https://github.com/a312863063/Model-Swap-Face
算法原理解读:http://www.seeprettyface.com/research_notes.html
Better model,Better performance
Note:这个项目展示的是我在数字模特方面的一些探索,希望通过降本增效的方式挖掘生成技术的实际商用价值。此项目展示的是仅支持端到端的单模特头像合成方案,即在保留输入模特表情信息的情况下生成一张更富样式吸引力的新模特。如果想了解支持多模特形象选择的方案可以参阅我的研究笔记。
效果预览
单图输入-输出展示
输入
模特风格输出
多图对比展示
多效果转换图预览
替换效果展示
此处是展示生成图像替换回原图的效果,引入了额外的后处理。
转小孩子风格图片——左:输入-右:输出
转网红风格图片——左:输入-右:输出
转多种风格图片——1排:输入-2-5排:输出
Inference框架
使用方法
环境配置
Both Linux and Windows are supported, but we strongly recommend Linux for performance and compatibility reasons.
64-bit Python 3.6 installation. We recommend Anaconda3 with numpy 1.14.3 or newer.
TensorFlow 1.10.0 or newer with GPU support.
One or more high-end NVIDIA GPUs with at least 11GB of DRAM. We recommend NVIDIA DGX-1 with 8 Tesla V100 GPUs.
NVIDIA driver 391.35 or newer, CUDA toolkit 9.0 or newer, cuDNN 7.3.1 or newer.
运行方法
1.按照netwotk/download_weights.txt所示将模型文件下载至networks文件夹下。
2.配置好main.py并运行python main.py。
多模特选择方案
多模特选择方案支持更多样的模特选择,实现方法可以参阅我的研究笔记。
后续计划
从短视频的发展趋势来看,动态的商品展示会更有吸引力,所以模特能够被“驱动”也很重要。所以,我后续会尝试去做一些语音和文本方面的技术研究,并将其融入进视觉生成当中。我认为基于语音驱动+图像生成的应用玩法非常多,会是下一个技术风口所在。
致谢
代码部分借用了Puzer和Pbaylies的代码,感谢分享。