arcface损失 应用分类识别_动漫人脸识别技术及数据集介绍

01a93f2e0eb2d0e8888947f3224f6aed.png

萧箫 发自 凹非寺
量子位 报道 | 公众号 QbitAI

看过的动漫太多,以至于认角色时有点脸盲?

试试爱奇艺推出的这个卡通人脸识别基准数据集iCartoonFace,用它训练AI帮你找动漫素材,效率分分钟翻倍。

358e51b9d3b3dcdde37331e1c7762d2c.png

对于脸型相近、但角色不同的二次元人物,能准确识别出来(脸盲福音):

bdd38cc55130bd98b071150cbd4dfaa5.png

如果人物视角出现变化,也能准确识别:

5d69b56ad3b019046d14fbe4fa777736.png

不仅如此,在人脸被大面积遮挡时,也能准确地识别出来:

7a8b868b7c4c4b0451f4486c736b03c5.png

至于阴影和光照也不在话下,哪怕站在树荫里,也能被AI“侦测”:

83000a84eeb9bfdb46630b136b4c2c7d.png

效果完全不输现有的真实人脸识别。

那么,这样的技术是怎么做出来的呢?

结合真人数据,训练卡通人脸识别

团队提出了一种卡通和真人的多人物训练框架,主要包括分类损失函数未知身份拒绝损失函数域迁移损失函数三部分,如下图所示。

f61df848870fe268d1c2ba80b43b1b6a.png

其中,分类损失函数主要用来对卡通脸和真人脸进行分类。

而未知身份拒绝损失函数,则是为了在不同域之间进行无监督正则化投影。

至于域迁移损失函数,目的是降低卡通和真人域之间的差异性,对他们的相关性进行约束。

针对这个框架,研究者们探讨了三个问题:哪种算法最好?人脸识别是否有助于卡通识别?上下文信息对卡通识别是否有用?

从实验结果来看,ArcFace+FL的效果最佳,所以此次团队选用了这个算法。

db9e21d8f52e0f800156bb1091ff24ff.png

至于后两个问题的答案,也是肯定的。

从下图的蓝线来看,加上真人人脸识别的信息后,对于卡通检测的识别同样有帮助。

0a7d30a789eb26ef451d4bad85a377d5.png

至于上下文信息,团队也做了实验,下图是算法在卡通人脸基础上扩充不同比例下的性能识别。实验证明,上下文信息越丰富,人脸识别的效果也会更好。

94b17a1125a115ac419b36576d49bcfc.png

事实上,动物角色训练出来的特征样本,相比于人脸来说,还是有点诡异。

下图中分别是原图和对应的特征样本,相比于动漫男生和女生,虹猫的特征显得有点……不可捉摸。

b37980104d06443c1276226c76d4efbb.png

不过这也说明,一个标准、大型的动漫人脸数据集是有必要的。

标注数据,只需要一步

为了减少人工标注的工作量,研究者们设计了一种半自动数据集构建框架,用于构建iCartoonFace数据集。

如下图,这个框架可以分为三个阶段:

4fb4920be512a7db478ab4dee8c83d1e.png

首先,对数据进行分层收集。先获取卡通图片信息,包括专辑人物名称,再获取卡通人物图片,使得数据集结构非常清晰。

其次,对数据进行过滤。利用卡通人脸检测、特征提取器和特征聚类等,对图片数据进行噪声过滤。

其中,特征提取器的性能会发生变化:随着标注数据的增多,性能不断增强。

最后,标注人员只需要做一个步骤:根据特征聚类的结果,回答两张图片是否是同一个人物。

f88b2530656e229c1d23259f22f617b2.png

目前最大的卡通人物标注数据集

事实上,目前已有大量针对真人的人脸识别的技术和算法。

然而,针对二次元人脸识别的数据集依旧少之又少,大多数数据集存在着噪音比例大、数据量小的问题。

但这样的需求的确存在,不局限于对视频的结构化分析,还能应用于图片搜索、广告识别等场景。

例如,给创作者提供智能剪辑、或者是对恶搞的讽刺漫画、卡通风格人物进行审核辨识。

针对这个现象,爱奇艺开放了目前全球最大的手工标注卡通人物检测数据集与识别数据集iCartoonFace,包含超过5000个卡通人物、40万张以上的高质量实景图片。

下图是iCartoonFace与其他已有动漫数据集的对比,基于这个数据集设计框架,可以有效地提高卡通人物识别性能。

972bf3cdd6d4d6826665187f19e1ae0d.png

说不定,真能让广大观众对动漫角色“不再脸盲”。

传送门

论文链接:https://arxiv.org/pdf/1907.13394.pdf

数据集(在竞赛数据集一栏):https://iqiyi.cn/icartoonface

END

9e7d7ee4cbf9b2e65e39a9aeeeeea2ee.png

备注:人脸

31c4c940cd89a61862f3ac3ee76fda1c.png

人脸技术交流群

人脸检测、识别、对齐、重建、表情识别、表情迁移等技术,

若已为CV君其他账号好友请直接私信。

我爱计算机视觉

微信号:aicvml

QQ群:805388940

微博知乎:@我爱计算机视觉

投稿:amos@52cv.net

网站:www.52cv.net

0a7a8777584423ca9798539852ef5e09.png

在看,让更多人看到  ae80da26b78aba2b627904cb8ec0856f.gif

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值