人脸特征点检测,可以看成一个像素级的预测问题。用全卷积神经网络来做,是近年来的新思路。本篇主要尝试用FCN实现人脸特征点检测,探索网络结构和训练技巧。
网络结构
现有的网络结构非常多,本次决定自行设计,采用最常用的类VGG结构。首先确定网络的输入图片大小为112*112,其中人脸大小为60*60。网络的层数由感受域确定,保证最小的那一层的感受阈覆盖图片的1/3大小左右。
于是设计出如下的网络结构:
网络结构如图:
问题
是否需要预训练?
可以用VGG的模型试试。
收敛速度慢?
加BN.
某个特征点对应的特征图完全被抑制?
使用prelu
添加Noise
在高层添加噪声,增强对遮挡的鲁棒性。实验结果表明,作用不大。