NeurIPS 2021:快手的动漫人物GAN

点击上方“机器学习与生成对抗网络”,关注星标

获取有趣、好玩的前沿干货!

金磊 发自 凹非寺 量子位 报道 | 公众号 QbitAI

动漫、艺术作品里的人物,他们极具张力的形象往往给人们留下深刻的印象。

但如果说现在,你也可拥有他们的同款造型呢?

没错,依旧来自是“无所不能”的GAN

只要把你pick好的形象“投喂”进去,接下来妆发的工作交给它就行了:

a466c597c5b2928c2910d3a22709adf3.gif

红的、黄的、蓝的、白的……发色随意改变,风格也随之变换。

这就是来自快手的BlendGAN,而且这项工作还被顶会NeurIPS 2021接收。

6da3eabf6f8db8e83d8ebe69fa800718.png

而与以往“变妆”GAN不同的是,BlendGAN号称能驾驭的风格是——任意

是有种“百变大咖秀”的那味了。

于是乎,这个项目成功在网上引起了众多网友的围观。

bc71f9f4e9ba9f31ea9100935c767be5.png

如何丝滑变妆?

那么,怎样拥有动漫人物同款造型呢?

很简单,只需要准备2张照片:

  • 一张生活照

  • 一张动漫人物造型

a7591942477ac8f643002fe159488d95.png

现在在Hugging Face里已经有了在线可玩的demo。

最简单的办法就是把这两张照片上传进去,等待一会儿就可以出结果了。

当然,稍微“技术”点的方法就是自己跑一遍程序了。

就在这两天,BlendGAN在GitHub上也已开源。

49105efccdfb19c3f2fceadbad2959a8.png

首先需要下载一些预训练模型,包括BlendGAN模型、PSP编码器模型和Style编码器模型。

7861bbc4c4601bf727fedf27dead84b1.png

然后仅需几句Python代码,便可出效果。

例如用随机人脸代码生成图像对,就输入:

python generate_image_pairs.py --size 1024 --pics N_PICS --ckpt ./pretrained_models/blendgan.pt --style_img ./test_imgs/style_imgs/100036.png --outdir results/generated_pairs/reference_guided/

若是要给照片换风格,则输入:

python style_transfer_folder.py --size 1024 --ckpt ./pretrained_models/blendgan.pt --psp_encoder_ckpt ./pretrained_models/psp_encoder.pt --style_img_path ./test_imgs/style_imgs/ --input_img_path ./test_imgs/face_imgs/ --outdir results/style_transfer/

要生成插值视频,则:

python gen_video.py --size 1024 --ckpt ./pretrained_models/blendgan.pt --psp_encoder_ckpt ./pretrained_models/psp_encoder.pt --style_img_path ./test_imgs/style_imgs/ --input_img_path ./test_imgs/face_imgs/ --outdir results/inter_videos/

为什么可以hold住任意风格?

那么快手的这个BlendGAN,为什么可以同时驾驭这么多的风格?

据研究介绍,团队首先是利用灵活的混合策略和通用的艺术数据集,来生成任意样式化的脸。

具体来说,就是在通用艺术数据集上,训练一个自监督Style编码器来提取任意样式的表示。

80595f331eda7435f0fb1dc709a1129f.png

在生成器部分,则提出了一种叫做加权混合模块 (WBM)的方法,来隐式混合人脸和样式表示,并控制任意的程式化效果。

8abcb1259c73e8445f3307a2022cbe91.png

以往诸如StyleGAN2在这个步骤中,不同分辨率层(resolution layer)负责生成图像中的不同特征,而团队认为它们在不同层的混合权值不应当是一致的。

因此,研究人员将人脸和风格latent代码转换到它们的W空间,然后再由WBM进行一个组合的工作。

由此得到的结果显示,与以往方法比较,BlendGAN能够得到更加逼真的效果。

5696b82bf68407cf29dcc78d60b8d392.png

作者介绍

本文的通讯作者是Li Qiang,现任快手Y-tech的算法工程师。

本科和硕士就读于华中科技大学;博士毕业于悉尼科技大学,师从陶大程教授。

其主要研究方向为深度学习、机器学习和概率图形模型,对卷积神经网络、深度生成模型、表示学习和结构化预测感兴趣。

最后,想试试变妆的小伙伴,可以戳下方链接体验一下~

在线试玩:

https://huggingface.co/spaces/akhaliq/BlendGAN

参考链接:

[1]https://pythonrepo.com/repo/onion-liu-BlendGAN-python-deep-learning
[2]https://github.com/onion-liu/BlendGAN
[3]https://arxiv.org/pdf/2110.11728.pdf

猜您喜欢:

等你着陆!【GAN生成对抗网络】知识星球!

CVPR 2021专题1:GAN的改进

CVPR 2021 | GAN的说话人驱动、3D人脸论文汇总

CVPR 2021 | 图像转换 今如何?几篇GAN论文

【CVPR 2021】通过GAN提升人脸识别的遗留难题

CVPR 2021生成对抗网络GAN部分论文汇总

经典GAN不得不读:StyleGAN

最新最全20篇!基于 StyleGAN 改进或应用相关论文

超100篇!CVPR 2020最全GAN论文梳理汇总!

附下载 | 《Python进阶》中文版

附下载 | 经典《Think Python》中文版

附下载 | 《Pytorch模型训练实用教程》

附下载 | 最新2020李沐《动手学深度学习》

附下载 | 《可解释的机器学习》中文版

附下载 |《TensorFlow 2.0 深度学习算法实战》

附下载 | 超100篇!CVPR 2020最全GAN论文梳理汇总!

附下载 |《计算机视觉中的数学方法》分享

02a41f79a7509c0f70daaefd7638b675.png

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值