Caffe与Lasagne使用——人脸关键点检测

最新推荐文章于 2022-09-21 23:48:10 发布

灰巧克力爱松露

最新推荐文章于 2022-09-21 23:48:10 发布

阅读量4.1k

点赞数 1

分类专栏： Deep Learning 文章标签： Caffe Lasagne Deep Learning Kaggle 人脸关键点检测

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/shadow_guo/article/details/51144778

版权

Deep Learning 专栏收录该内容

24 篇文章 1 订阅

订阅专栏

Caffe与Lasagne 使用——人脸关键点检测

一. Caffe求解回归问题

在使用Lasagne之前，我尝试用Caffe做回归问题。毕竟Lasagne是基于Theano的，所以训练速度上Caffe占优。

1. 尝试方法

清理掉标签数据中的NaN值后，尝试过下述方法：

(1) 输出数据根据最大值和最小值归一化到[0,1]区间内；

(2) 输出数据属于不同分布，归一化至标准正态分布，均值升为0.5；

(3) 修改网络结构，微调model zoos中的网络。

2. 实验结果

(1) 训练发散，方法1可以解决；

(2) 方法1解决后的直接后果是Caffe训练后收敛并且有一些损失；

(3) 方法2和3会使得网络不会发散，仅仅在一开始快速收敛，后面会在一定范围内震荡。

3. 联系作者

联系Balakrishnan Prabhu先生 [1]后，他建议我：

(1) 先清理数据中的NaN，否则收敛时会产生很多问题；

(2) 对层文件使用xavier权重：

    weight_filler{
      type: "xavier"
    }

    bias_filler {
      type: "constant"
      value: 0.1
    }

(3) 学习率太快或太慢？调整它。

二. 相关工作

观察[1]中给出的效果，Caffe回归时最后还是收敛到均值。所以Balakrishnan Prabhu先生选择了快速收敛的那一时刻的模型。

达闻西在知乎中[3]给的实例是单变量回归，但输出变量为有序程度，可以解释为这张图片是有序图片的可能性是多少，虽损失层修改为欧几里德损失，和分类问题的区别在于把分类的one-hot格式变成了检测为有序图片的概率。

陈日伟[4]也给出了人脸关键点检测的操作。卷积层变为LOCAL层，但图像分辨率从96*96大幅下滑为39*39，定位精度会受到影响。效果见其博客和代码。

Daniel Nouri[2]给出的结果最好，网络训练采用Lasagne，同时公布了源码。由于 Journey-Dream[5]已经详细翻译了原文，所以细节方面有问题可以再讨论。

三. Step by Step

Daniel Nouri的网络模型类似Yann LeCun的经典CNN模型，大致提供了两个CNN模型：第1个为整体网络模型，第2个为局部网络模型。

1. 整体网络模型

网络输出为图像中每个人脸关键点的所有坐标。整体网络模型的输入依次发生变化。这里定义net1为单个隐含层的神经网络，net2为卷积神经网络(cnn)，net3为数据增强（增加水平方向对称的图像）后的cnn，net4为图像增强和学习率可调时的cnn，net5为图像增强，学习率可调和带Dropout时的cnn。我的训练和验证曲线如下（横坐标为训练次数，纵坐标为验证时像素坐标的均方根误差（Root Mean Squared Error））：

整体网络模型的测试图像效果如下：

2. 局部网络模型

人脸关键点被划分为不同的区域，网络输出为每个区域的关键点坐标。可以用训练好的整体网络模型的权重为初始值，微调局部网络模型时修改整体网络模型的输出。

3. 提交结果

Kaggle中挑战赛的Leaderboard更新得很快，过一段时间后反正名次很快也会被刷下去，不如趁热截图 ~ ~||。

四. 参考链接

[1] corpocrat.com/2015/02/24/facial-keypoints-extraction-using-deep-learning-with-caffe/

[2] danielnouri.org/notes/2014/12/17/using-convolutional-neural-nets-to-detect-facial-keypoints-tutorial/

[3] www.zhihu.com/question/37351143

[4] blog.csdn.net/chenriwei2/article/details/49706563

[5] blog.csdn.net/tanhongguang1/article/details/46056663

灰巧克力爱松露

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
4
评论
Caffe与Lasagne使用——人脸关键点检测

Caffe与Lasagne 使用——人脸关键点检测一. Caffe求解回归问题在使用Lasagne之前，我尝试用Caffe做回归问题。毕竟Lasagne是基于Theano的，所以训练速度上Caffe占优。1. 尝试方法清理掉标签数据中的NaN值后，尝试过下述方法：(1) 输出数据根据最大值和最小值归一化到[0,1]区间内......
复制链接

扫一扫

专栏目录

评论 4

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。