neruel network yricks of the trade 总结

Emma-SJ

于 2017-04-17 21:11:41 发布

阅读量506

点赞数 1

分类专栏： caffe

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/baidu_17806763/article/details/70216126

版权

caffe 专栏收录该内容

11 篇文章 0 订阅

订阅专栏

neruel network yricks of the trade 总结

### back propagation
1. bp算法 + SGD梯度下降法 + betch learning；
2. 输入数据正则化（均值为0，方差正则化，输入变量去相关），可以利用每张图片都减去均值来实现均值为0；
3. 使用Sigmoid激活函数（收敛速度快）；
4. label的选择最好在sigmoid的范围内（但是caffe的label只能从0开始取）；
5. 权重初始化（0均值，标准差的某分布），如果要finetuning的话就没有关系了；
6. 学习率的选择，增加Momentum选项，每个权重使用单独的学习率；
7. RBFs适合用在低层网络，Sigmoid更适合用在高层网络中；
8. 如果数据量很大，使用随机梯度下降，如果数据量小或者是回归任务，使用联合梯度下降；

EMMA
SIAT
2017.04.17

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。