干货 | 抖音漫画效果解密

最新推荐文章于 2024-05-20 20:08:58 发布

小白学视觉

最新推荐文章于 2024-05-20 20:08:58 发布

阅读量5.6k

点赞数

文章标签：算法机器学习人工智能计算机视觉 python

点击上方“小白学视觉”，选择加"星标"或“置顶”

重磅干货，第一时间送达

本文转自：AI算法与图像处理

抖音漫画效果

要说最近抖音最火的效果是什么，无疑就是上周推出的漫画效果，这里本人来对该效果进行一些技术分析。

首先，我们先看一下效果展示：

Fig.1 实时版本

Fig.2 图片版本

这个效果可谓非常惊艳，真切的将真人照片转换为了漫画风格，而且支持多人处理，也是因此，一时间刷遍了抖音和朋友圈，周末两天的使用量达到了20亿次以上。

对于抖音的漫画效果，包括两个版本，一个是实时处理版本，也就是抖音上线的第一个版本，如图Fig.1所示，可以实时展示漫画效果；另一个是后来的图片版本，如图Fig.2所示，这个版本更加精细；该功能目前同步上线字节跳动旗下的一些app，比如：抖音/剪映/FaceU等。

下面，我们针对这个动漫效果来做一些技术分析，帮助大家了解一下背后的技术秘密。

技术解密

本人以实时版本为例，经过分析和测试，对该效果做了如下几点总结：

1，实时版本中，漫画并非全图处理，而是基于人脸矩形框区域进行动漫处理；
2，人脸之外的背景区域非漫画效果，而是做了一些类似漫画的滤镜处理；
3，整体漫画分辨率不高；
4，不同的人脸，漫画人脸风格始终保持一致；

本人多年来一直从事人像特效相关工作，这里，我们先了解一下漫画风格的特点，这里总结如下：

1，线条化，漫画风格的边缘比较突出，主要表现为线条感强烈；

2，颜色单一，一种漫画风格往往使用的颜色数比较少，不会像真实照片中那样包含那么多颜色数，往往只有几种颜色搭配，比如新海诚效果，如图Fig.3所示；

Fig.3 新海诚漫画风格举例

3，人脸五官简单、夸张，这一点可以参考大多数漫画的五官分类，抖音漫画的五官绘制模型如下图Fig.4所示；

Fig.4 抖音漫画五官模型

与正常的真人照片相比，鼻子，嘴巴和眉毛基本都以线条来表达，简单清晰，而眼睛则表现为夸张的大眼睛，也比较符合漫画的审美；

有了上述的知识前缀，我们就可以对漫画风格有所理解了。本人先做了一个简单的测试，用美女景甜的图做了漫画效果如下Fig.5：

Fig.5 抖音实时漫画效果举例

通过这个效果我们可以发现对于景甜的人脸五官，漫画效果非常好，但是右图却隐约看到了一个人脸框区域，在这个区域之外的漫画风格好像与人脸框内不太一样，仔细观察，确实如此，这也和前面本人的总结相一致了，也就是说，漫画风格只处理了人脸框区域。

为什么这么做？本人认为有以下几点：

①人像照片包括半身照和全身照以及多人情况，分类复杂，场景也复杂，直接全图处理技术上要更难一点；
②实时版本追求用户的实时处理，对时间消耗要求较高，如果全图处理，很有可能无法达到实时要求；

对于人脸框之外的区域，本人也做了分析，发现，这些区域是做了一些颜色滤镜和包边特效之类，整体的色调与动漫色调保持一致；

复现与改进

综合以上几点，本人对实时版本的动漫效果算法流程做了如下设计：

1，假设用户图为S，效果图为D，将S进行人脸检测，得到人脸区域图像A，A一般为正方形；
人脸检测技术目前已经较为成熟，开源算法也较多，大家可以自行了解；
2，使用深度学习技术来生成漫画效果，这一步个人猜测，抖音大概率应该是使用的GAN网络，通过图像直接生成效果，即输入图像A，输出人脸漫画效果图B；
目前可以实现漫画效果的可行性网络，本人推荐：Pix2Pix，CycleGan，CartoonGan等，
3，构建一张与A大小相同的正方形蒙版图C，这个蒙版为黑白色，白色表示前景，黑色表示背景，如下图Fig.6中的蒙版所示；
4，对图S进行滤镜调色和保边算法处理，得到图M，使得M的色调与B一致；
5，将M和B按照蒙版C进行Alpha混合，C图像素灰度值表示为alpha值，得到最终效果图D，公式如下：
D = B * alpha + (1 - alpha) * M
6，将D填充到S即可。

整个流程如图Fig.6所示。

Fig.6 抖音漫画剖析图

上述步骤就是本人对抖音实时版漫画效果算法的推演解析，当然，只是个人意见。上述的难点在于第2步骤中，如何生成漫画效果，这个步骤中，如果选用Pix2Pix网络，那么需要成对的样本，也就是一张原图对应一张漫画效果图，这样的样本非常稀缺，也非常难以制作，因此，本人觉得抖音应该没有使用这个方法。而CycleGan不需要成对的样本来训练，因此个人觉得，CycleGan是个不错的选择！

本文主要针对当前最新技术进行了一些细节分析，由于没有实现，因此，代码无从参考，不过，无论是Pix2Pix还是CycleGan，代码在github上都有开源，这个不是什么难事，总之，这个效果，关键问题就是样本和优化。

这里我们给出一些相关代码链接：

Pix2Pix:
https://github.com/williamFalcon/pix2pix-keras
CycleGan:
https://github.com/simontomaskarlsson/CycleGAN-

Keras
https://github.com/d1ggs/cycleGAN-keras
CartoonGan:
https://github.com/penny4860/Keras-CartoonGan

原文链接：

https://trent.blog.csdn.net/article/details/106958365

最后，本人使用Pix2Pix做了一些其他风格的漫画特效，如下图所示：

作者图书

https://u.jd.com/4bDoGL

下载1：OpenCV-Contrib扩展模块中文版教程

在「小白学视觉」公众号后台回复：扩展模块中文教程，即可下载全网第一份OpenCV扩展模块教程中文版，涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。

下载2：Python视觉实战项目52讲

在「小白学视觉」公众号后台回复：Python视觉实战项目，即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目，助力快速学校计算机视觉。

下载3：OpenCV实战项目20讲

在「小白学视觉」公众号后台回复：OpenCV实战项目20讲，即可下载含有20个基于OpenCV实现20个实战项目，实现OpenCV学习进阶。

交流群

欢迎加入公众号读者群一起和同行交流，目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群（以后会逐渐细分），请扫描下面微信号加群，备注：”昵称+学校/公司+研究方向“，例如：”张三 + 上海交大 + 视觉SLAM“。请按照格式备注，否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告，否则会请出群，谢谢理解~