CVPR 2023 | STAR Loss：减少人脸关键点标注歧义，实现人脸关键点SOTA精度

最新推荐文章于 2024-06-16 09:48:26 发布

PaperWeekly

最新推荐文章于 2024-06-16 09:48:26 发布

阅读量815

点赞数 3

本文链接：https://blog.csdn.net/c9Yv2cf9I06K2A9E/article/details/133108439

版权

本文介绍了STAR Loss，一种用于解决人脸关键点检测中语义歧义问题的损失函数。STAR Loss通过自适应各向异性方向损失减少歧义影响，提高了面部特征点检测的性能，实现在多个数据集上的SOTA结果。方法通过PCA分析预测分布，以第一主成分方向上的误差为主，结合不同距离函数和约束策略，有效降低了标注不一致带来的影响。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

论文链接：

https://arxiv.org/pdf/2306.02763.pdf

代码链接：

https: //github.com/ZhenglinZhou/STAR

要解决的问题：人脸关键点检测标注中存在语义歧义问题。语义歧义是指不同的标注者对同一个面部特征点的位置有不同的理解，导致标注结果不一致，影响模型的收敛和准确性。

解决方案：提出一种自适应各向异性方向损失（STAR loss，Self-adapTive Ambiguity Reduction loss），利用预测分布的各向异性程度来表示语义歧义。STAR loss 能够自适应地减小语义歧义的影响，提高面部特征点检测的性能。

效果：在三个人脸关键点数据集上超越了现有方法，实现 SOTA。

相似工作：存在几项工作解决面部关键点检测中的语义歧义问题。SBR 使用相邻帧之间光流的一致性作为监督，但对照明和遮挡敏感。LAB 使用面部边界线作为结构约束，这在实践中可行但计算开销大。此外，SA 提出潜在变量优化策略来找到语义一致的注释，并在训练阶段减轻随机噪声的影响。

然而，复杂的训练策略限制了其应用。与本文工作最相关的是 ADNet，它提出了两个关键模块，即各向异性方向损失（ADL）和各向异性注意力模块（AAM），以处理模棱两可的注释问题。其中，ADL 在面部边界上的关键点的法向施加更多约束，但方向和约束权重是手工设计的，这种粗糙的设计降低了其性能。

前言

简要介绍当前广泛使用的回归方法的流程。

如图 2 顶部所示，回归方法的基本模型由四个 Hourglass Networks（HGs）堆叠而成。每个 HG 为 N 个关键点生成 N 个热力图，其中 N 是预定义关键点的数量。归一化后的热力图可以看作是预测关键点位置的概率分布。预测的坐标从热力图中通过 soft-Argmax 解码。形式上，给定一个离散概率分布，将值定义为关键点定位在的概率。期望坐标 μ 通过 soft-Argmax 解码：