【人脸关键点检测论文解读】Facial landmarks localization using cascaded neural networks

论文链接
论文中提到的一些知识点:
1、反向传播
2、CED : NME和数据集比例曲线,衡量在NME达到一定错误率时,已经覆盖的数据集比例,模型的鲁棒性指标
3、AUC(area under the curve)是ROC曲线下的面积

这篇论文是2021年发表在计算机视觉和图像理解(CVIU)上面的
在这里插入图片描述
所提出的级联 CNN (CCNN) 利用了两个成对的级联子网络:热图子网络 (CHCNN) 估计与面部标志对应的粗略但稳健的热图,而级联回归子网络 (CRCNN) 通过回归改进 CHCNN 生成的标志的准确性. 两个级联子网络对齐,以便每个 CHCNN 单元的输出用作相应 CRCNN 单元的输入。这允许对定位点进行迭代细化。CCNN 是一种完全由数据驱动且可端到端训练的人脸定位方案。它扩展了之前基于热图的本地化结果(Belagiannis 和 Zisserman,2017 年),实验证明它对头部姿势的大变化具有鲁棒性。此外,当使用最先进的人脸对齐数据集进行评估时,它与当代人脸定位方案相比具有优势。所提出的 CCNN 方案不利用人脸的任何特定外观属性,并且可以应用于其他类别对象的定位。

在这里插入图片描述
这是CCNN的整体框架图
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
其他方法显示出对所考虑场景的显着依赖性,在正面人脸图像(例如 HELEN 和 LFPW 数据集中的图像)上表现良好,但在具有挑战性的条件下(例如 300-W私有数据集)往往会失败

在这里插入图片描述
绿点的大小根据估计地标的误差而增加。当误差超过20像素时,一条线将真实值和估计的地标连接起来。当误差大于30像素时,关键点将被绘制成蓝色。

为什么所提出的方案可能导致错误估计?
出现失真(2、8)、局部遮挡有问题(5、13)、灰度图像(15)、存在多个人脸图像(1、12、14 和 16)、缺失边缘(3、11)、几个地标点落在狭窄区域(4、6、7、9、10 和 17)

在这里插入图片描述

在这里插入图片描述
当使用两个单元而不是单个单元时,可以获得最显着的改进,额外的级联提供相对较小的增益。

在这里插入图片描述

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值