论文阅读 Robust Facial Landmark Detection via a Fully-Convolutional Local-Global Context Network

Abstract

1)文章提出了新的全局的语义框架融入到整个网络中。网络设计的关键是核卷积,核卷积的关键在于此处的卷积核没有参数学习,是固定的一个核。此核能够模糊local 网络的输出,实则是平滑输出,然后用global网络进行refine
2)后处理上用了一个2D-PCA based 网络模型来过滤外点

Contribution

  1. 提出了核卷积
  2. 用dilation卷积扩大感受野
  3. 整个方法可以不适用人脸检测

Local-global context network

文章网络的主要优点在于考虑了全局信息,point distribution model应用在了后处理上面。这篇文章能够利用dilated卷积,避免了过拟合现象,而能够充分使用带孔卷积的原因在于heavily depends on the implicit kernel convolutions。

预处理

将图像转换为灰度图像,标签就是在gt点的地方置为1,没有使用高斯

Network architecture

  1. Local-context, fully-convolutional network
  2. Convolution with a (customizable) static kernel
  3. Global-context, dilated fully-convolutional network
  4. Square error-like loss versus kernel-convolved labels

Local-context subnet
Local-context subnet就是堆积了15个卷积,最后一个1x1的卷积来补偿BN

Kernel convolution
Local-context subnet被kernel卷积。kernal卷积是一个group=1的group convolution,等同于channel-wise的convolution。他在训练和测试的时候都会被用到。

kernal卷积的作用
1、The pixel-wise square loss now correlates with the distance between prediction and ground truth
2、The global-context subnet can take advantage of dilated rather than dense convolutions.

不仅要对网络进行kernal 卷积,同样的对于标签也要进行kernal卷积,一张gt map只有一个点是目标位置而不是高斯这种形式的gt显然是不合理的。
这里写图片描述
最终的核的形式如上式
将该核进行平移后与未平移的该核做差,得出下面的图
这里写图片描述
在11px左右normalized error为0.5,所以再11px以内进行奖励,在11px之外进行惩罚

Global-context subnet
在global的语义子网络里,可以使用大的卷积核进行操作,但是为了避免过拟合的现象,就采用带孔卷积更为实际一些。带孔卷积会是一个downsample的过程,会造成结果的不连续,因此不太合理,但是由于之前的map已经被kernal convolution进行了平滑(低通滤波器),所以这里使用带孔卷积的时候不需要考虑带孔卷积带来的不连续情况。

对于local的结果已经很具有判别性了,所以对global的要求是不应该聚焦在pixel的层面上,而应该关注全局的信息多一些。这个的global网络不是从头开始而是对之前的预测的local结果进行了一个refine的操作。
这里写图片描述
最终的输出是local和global相加的形式,但是只在local和global地方加监督而不再最后的预测的输出加监督。global部分的网络由起个0padded的带孔卷积组成,dilation=4。

Loss

对于landmark点的每一个作者都设置了一个权重,根据是否标注以及是否在界内外。
这里写图片描述
最终的损失是全局加local
这里写图片描述

网络结构如下
这里写图片描述
local和最终的输出的示意图
这里写图片描述

From heatmaps to coordinates

从热度图到最终的坐标,一般来讲会直接取最大值,但是这种每张map最大值的情形仅仅适用于关键点比较少的情况(疑问脸),然后如果事先确定一个阈值,仅仅在阈值以上的情形是要求取最大,这种情形又是会引进outliers。作者设计了一个2D-PCA based的模型
we interpret the output heatmaps as likelihoods and fit an outlier-robust PCA-based 2D shape model. The model is able to recover from false detections, but also reconstruct occluded or truncated landmarks to a reasonable extent

作者首先对heatmap找到最合适的旋转,产生线性系统等式,每一个像素对应一个等式,用该点像素值进行加权,只有权重大于1%的才考虑进行相关的计算

实验

作者做了很多相关的对比试验,当然作者最后做了一个在全图的实验,证明他们的网络即使不使用bounding box预处理也是可以的。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
提供的源码资源涵盖了Java应用等多个领域,每个领域都包含了丰富的实例和项目。这些源码都是基于各自平台的最新技术和标准编写,确保了在对应环境下能够无缝运行。同时,源码中配备了详细的注释和文档,帮助用户快速理解代码结构和实现逻辑。 适用人群: 适合毕业设计、课程设计作业。这些源码资源特别适合大学生群体。无论你是计算机相关专业的学生,还是对其他领域编程感兴趣的学生,这些资源都能为你提供宝贵的学习和实践机会。通过学习和运行这些源码,你可以掌握各平台开发的基础知识,提升编程能力和项目实战经验。 使用场景及目标: 在学习阶段,你可以利用这些源码资源进行课程实践、课外项目或毕业设计。通过分析和运行源码,你将深入了解各平台开发的技术细节和最佳实践,逐步培养起自己的项目开发和问题解决能力。此外,在求职或创业过程中,具备跨平台开发能力的大学生将更具竞争力。 其他说明: 为了确保源码资源的可运行性和易用性,特别注意了以下几点:首先,每份源码都提供了详细的运行环境和依赖说明,确保用户能够轻松搭建起开发环境;其次,源码中的注释和文档都非常完善,方便用户快速上手和理解代码;最后,我会定期更新这些源码资源,以适应各平台技术的最新发展和市场需求。 所有源码均经过严格测试,可以直接运行,可以放心下载使用。有任何使用问题欢迎随时与博主沟通,第一时间进行解答!
提供的源码资源涵盖了小程序应用等多个领域,每个领域都包含了丰富的实例和项目。这些源码都是基于各自平台的最新技术和标准编写,确保了在对应环境下能够无缝运行。同时,源码中配备了详细的注释和文档,帮助用户快速理解代码结构和实现逻辑。 适用人群: 适合毕业设计、课程设计作业。这些源码资源特别适合大学生群体。无论你是计算机相关专业的学生,还是对其他领域编程感兴趣的学生,这些资源都能为你提供宝贵的学习和实践机会。通过学习和运行这些源码,你可以掌握各平台开发的基础知识,提升编程能力和项目实战经验。 使用场景及目标: 在学习阶段,你可以利用这些源码资源进行课程实践、课外项目或毕业设计。通过分析和运行源码,你将深入了解各平台开发的技术细节和最佳实践,逐步培养起自己的项目开发和问题解决能力。此外,在求职或创业过程中,具备跨平台开发能力的大学生将更具竞争力。 其他说明: 为了确保源码资源的可运行性和易用性,特别注意了以下几点:首先,每份源码都提供了详细的运行环境和依赖说明,确保用户能够轻松搭建起开发环境;其次,源码中的注释和文档都非常完善,方便用户快速上手和理解代码;最后,我会定期更新这些源码资源,以适应各平台技术的最新发展和市场需求。 所有源码均经过严格测试,可以直接运行,可以放心下载使用。有任何使用问题欢迎随时与博主沟通,第一时间进行解答!

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值