人脸方向学习(十九):Face Landmark Detection-SBR-解读

最近刷到CVPR和ICCV近两年来在关键点方面的论文,简单总结下,主要是想选一些在移动端能部署的网络结构。最近两年的关键点论文主要用一些主流的方法去做的,比如用教师模型去筛选检测之后的关键点(知识蒸馏),用风格转移的方式去合成人脸(风格迁移),还有用光流利用帧与帧之间的信息去模糊的(去模糊)。对比之后发现这些网络都比较复杂,不适合移动端。但是18年SAN用聚类的方式选出风格,然后用GAN合成人脸(cycleGAN),但是训练阶段比较简单,用的网络就是VGG合成多尺度信息,NME测试仅次于PFLD,作者也公布了代码(pytouch),所以可以考虑在移动端部署。
 

2、Supervision-by-Registration: An Unsupervised Approach to Improve the Precision of Facial Landmark Detectors(SBR)

论文地址:https://arxiv.org/abs/1807.00966

目前训练 CNN 模型需求少量的标注数据。但是标注少量的数据需求耗费很多的人力资源,并且人工标注往往不精确。如下图所示是在两张嘴的图片上标注 16 个关键点的地位,一个颜色表示一个关键点,我们给出了九个标注人员的标注后果,可以发现每个标注人员对关键点的定位方差很大。这些标注误差对训练和测试模型会有很大的影响。因而,就想能不能运用一种不需求人工标注的监视信息来训练 CNN 模型?基于这个目的,提出了 supervision be registration,应用视频里相邻帧间时序分歧性来作为监视信息。

Supervision-by-Registration(SBR) 是一个训练人脸关键点检测器的算法框架,可以应用无监视的方式加强任何基于图像的人脸关键点检测器。SBR 应用了物体在视频中的运动比拟平滑的特性来提升一个现有的人脸关键点检测器。相比拟其别人脸关键点检测算法,SBR 不需求应用任何额定的人工标注信息就能提升检测器的功能。

SBR 运用的训练数据是有标注的图像数据和无标注的视频数据。在训练进程中,SBR 可以用无监视的方式从视频中提取监视信息来优化检测器(神经网络)。在测试阶段,运用 SBR 训练的模型,可以在图像或视频数据上到达具有更高的精度,并且能让在视频中检测后果愈加波动。

下图是 SBR 的框架表示图。

SBR 的训练进程包括两个损失函数。一个是检测器损失函数,另一个是时序配准损失函数。这两者可以互相补充让人脸关键点检测器愈加鲁棒。检测器损失函数作用于模型检测后果和人工标注上,优化使得在有标注的数据上,模型的检测后果和人工标注尽能够的接近。时序配准损失函数是优化在延续几帧内关键点检测后果的时序分歧性。详细来说,输出延续的两帧图像 t-1 和 t,经过同一团体脸关键点检测器后,可以失掉关于第 t-1 帧的检测后果和第 t 帧的检测后果,我们将第 t-1 帧的检测后果经过 Lucas-Kanade 算法跟踪到第 t 帧失掉后果,时序配准损失函数就是为了让在第 t 帧上跟踪失掉的后果和检测失掉的,尽能够分歧。值得留意的是,由于 Lucas-Kanade 算法不需求训练且有封锁解,我们将 Lucas-Kanade 算法写成了一个可求导的模块嵌入到 CNN 中。在训练的时分,检测器损失函数应用人脸外观信息经过人工标注学习关键点检测器;时序配准损失函数经过嵌入 Lucas-Kanade 模块保证了时序分歧性。梯度可以经过 Lucas-Kanade 模块传给检测模型使得检测后果在相邻帧上分歧。(关于不同的检测器,检测器损失函数能够有所不同,比方比拟经典的 CPM 和 Hourglass 运用 mean squared error 来优化检测器,也有一同些办法运用 L2 loss 优化。SBR 是一个通用的算法,可以作用于各种不同的人脸关键点检测器,提升他们的功能。)

SBR 的中心是时序配准损失函数,依赖于 Lucas-Kanade 跟踪模块,所以跟踪的后果的好坏直接影响着 SBR 的效果。同时,检测器预测的坐标是 Lucas-Kanade 跟踪模块的初始化坐标,只要当这个初始坐标大致精确的时分跟踪才有意义。所以运用需求留意两点,(1)当检测器在标注图片初始化好之后在开端运用 SBR 训练。(2)选择无标注的视频时需求留意视频的分辨率/人脸大小/遮挡等条件来保证 Lucas-Kanade 跟踪模块可以成功跟踪。 

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
HRNet是一种用于面部关键点检测的人工智能模型。面部关键点是面部的几个具有重要意义的特定点,例如眼睛、鼻子、嘴巴等。HRNet采用高分辨率表示的思想,通过构建一个多分辨率的深度网络来提取不同层次的特征,从而提高了模型对细节的感知能力。 HRNet-Facial-Landmark-Detection是基于HRNet的面部关键点检测模型。它通过先对输入图像进行预处理,将图像转换为HRNet网络能够处理的格式,然后通过多层次的卷积神经网络提取图像中的特征。这些特征包含了面部关键点的信息,然后通过一个后续的全连接层将这些特征映射到最终的关键点位置。 HRNet-Facial-Landmark-Detection具有准确度高、鲁棒性强的优点。它可以在低光、遮挡等复杂环境下,准确地定位面部关键点。因此,HRNet-Facial-Landmark-Detection人脸识别、表情识别、虚拟现实等领域具有广泛的应用前景。 需要注意的是,HRNet-Facial-Landmark-Detection的性能受到输入图像质量和数据集的限制。如果输入图像质量较差或数据集中没有涵盖模型需要的样本多样性,可能会降低模型的准确度。此外,模型的训练和测试过程需要耗费大量的计算资源和时间。 总之,HRNet-Facial-Landmark-Detection是一种高效、准确的面部关键点检测模型,它可以在复杂环境下准确地定位人脸的关键点位置。它的应用领域广泛,有助于改进人脸识别、表情识别和虚拟现实等技术。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值