关键点检测是计算机视觉中比较重要的任务之一,当前主流的算法可总结如下:
1、基于coordinate
即将卷积神经网络(CNN)的特征通过一个全连接层来回归关键点的坐标和对应的置信度信息,在对卷积
特征的利用上,逐渐由单层特征到金字塔特征转换,有代表性的算法为人脸关键点检测的PFLD算法,全称为:
《PFLD:A Practical Facial Landmark Detector》
2、基于heatmap
顾名思义,其核心思想是将输出的特征层利用卷积来得到各个关键点的置信度,即,每个通道代表了某个
关键点在输入图片上各个位置的置信度,随后在每个通道上取置信度最大值和对应位置即可;heatmap的生成
方式较多样,如使用高斯分布将距离关键点中心远的位置设置低点,呈现出辐射状。
3、基于heatmap + offset
该方法与2中所述方法相似,仅在回归时加入了坐标偏移量,使用这一方式可以将网络输出特征图下采样至
更小尺度,比较典型的算法为《Towards Accurate Multi-person Pose Estimation in the Wild》,其在设计
ground truth时,使用了多对一的方式,即将某一点作为中心点,半径R范围内的点用来回归该点。
上述方法主要介绍了关键点检测的一些发展放向,当下关键点检测与目标框检测的任务融合是一种主流发展方
向。