论文阅读 StarGAN Based Facial Expression Transfer for Anime Characters

StarGAN Based Facial Expression Transfer for Anime Characters 论文阅读
(这篇论文没啥创新意义,主要学习一下数据收集、处理)

关键词:动画、面部表情

主要贡献:
1)提供了一个有标签的数据集,它收集自Danbooru和GetChu,包含5个动画表情(happy、sad、crying、neutral、surprised),每个表情平均有一千张图片。我们还实现了一个开源的可移动应用来加快图片标记和检测假阳性的错误。
2)使用StarGAN作为我们的基本模型来进行面部表情迁移,使用CARN超像素模型对图片进行预处理,我们成功实现动画人物的表情变化。

方法

数据准备

Danbooru:一个免费的图片托管网站,用户可以使用他们自定义标签上传动画图片。
Getchu:提供游戏动画人物的标准图像。

  1. 我们首先根据使用爬虫工具gallery-dl4从Danbooru将图片和它的标签收集起来,我们在搜索关键词中使用了‘manga’关键词,来限制搜到的图片是彩色图片。
  2. 我们使用‘lbpcascade animeface’——一个预训练的卡通脸检测器,来检测脸。我们使用启发式图像来丢弃那些有超过6张脸的图片。
  3. 通过脸部检测器,我们可以知道眼睛、嘴、鼻子的位置。因此我们对图片进行旋转让眼睛的中心能够在同一个水平线。我们使用眼睛之间的距离的1.35倍来选择脸周围的边框。
  4. 最后,我们手动删除了false positives。
    下图为我们专门开发的app:
    在这里插入图片描述

数据预处理和数据增强

我们从网络中收集的数据大部分都是92px到112px的方形图片。我们使用了CARN超像素框架(放大比例为2)来预处理并提高图片的分辨率,且通过减少噪声来提高图片质量。最后,我们将其放大到224x224的大小,同时使用数据增强(先random crop 192x192的图片,再random flip)。

模型

StarGAN通过在Discriminator内增加一个辅助domain分类器,实现了使用一个GAN进行多个domain之间的映射。
generator:由两个卷积层来下采样、6个残差块,两个转置卷积来上采样。
Discriminator:使用了基于PatchGAN的结构。
loss:对抗损失、domain分类损失、重建损失。
在这里插入图片描述
为了适应我们自定义的数据集,我们对模型做了一些修改(详细见论文)。

评估

250k个迭代,使用一个Nvidia 1080 TI GPU , batch size=16, 训练花了一天多四个小时来完成训练。
在这里插入图片描述

《基于深度学习的面部表情识别:一项调查》是一篇发表在IEEE Access期刊上的论文。本论文综述了基于深度学习的面部表情识别的最新研究进展。 面部表情识别是计算机视觉领域的重要研究方向之一,广泛应用于情感分析、人机交互、虚拟角色等领域。传统的面部表情识别方法常常需要手工提取特征,且受到光照、姿态等因素的限制。而基于深度学习的面部表情识别则无需手工设计特征,可以从原始像素中直接学习特征表示,因此能够更好地解决这些问题。 本文首先介绍了深度学习在面部表情识别中的应用,包括卷积神经网络(CNN)和循环神经网络(RNN)等。CNN在面部表情识别中起到了关键作用,它可以提取图像的空间特征。RNN则主要用于处理序列化的面部表情数据,可以捕捉到表情的动态变化。 接着,本文概述了深度学习在面部表情识别中的不同应用场景,包括静态图像识别、视频序列识别和实时识别等。在静态图像识别中,通过对单张图像进行分析得出表情类别。在视频序列识别中,可以利用RNN结合CNN对连续视频帧进行处理,从而对表情做出连续预测。在实时识别中,需要实时地对实时视频流中的表情进行识别,对算法的实时性提出了挑战。 最后,本文总结了当前基于深度学习的面部表情识别的挑战和未来的研究方向。尽管深度学习在面部表情识别中取得了显著进展,但仍然存在一些挑战,如样本不平衡、多标签问题和泛化能力等。未来的研究可以探索更加有效的网络架构和训练方法,以提高面部表情识别的性能和适应性。 总之,本论文通过深入调查和总结,对基于深度学习的面部表情识别进行了详细介绍,并提出了未来的研究方向,对相关领域的学者和研究人员具有一定的参考价值。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值