深度学习基础总结

littlely_ll

于 2017-11-21 20:57:24 发布

阅读量1.1k

点赞数

分类专栏：深度学习文章标签：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/littlely_ll/article/details/78596862

版权

深度学习基本技巧

选择合适的损失函数

平方损失

交叉熵损失

…

小批量样本（mini-batch）

首先打乱数据，然后选择合适的小批量样本，重复epoch次。例如样本量100，小批量mini-batch样本为20，epoch为10。则先打乱这100个样本，顺序选取20个样本，更新一次参数，然后再选取下20个样本，再更新一次参数，直到把100个样本选取完，这样重复epoch（10）次。
其他的可以使用随机梯度下降为一个一个的选择样本更新参数，而批量梯度下降使用全部样本更新一次参数。
##使用新的激活函数
常用的为sigmoid, tanh。

ReLU（Rectified Linear Unit）

这里写图片描述

ReLU的变体

LeakyReLU
这里写图片描述

parametric ReLU
这里写图片描述
其中， $\alpha$ 由梯度下降法学习

#Maxout

这里写图片描述

适应性学习率（adaptive learning rate）

仔细设置学习率，如果学习率偏大，则每次更新后总损失不会下降，而学习率偏小时，训练会很慢。
简单却流行的算法为学习率随着时间变化而减小， $\eta^{t} = \frac{\eta}{\sqrt{t+1}}$ 。

Adagrad

最低0.47元/天解锁文章

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
4
评论
深度学习基础总结

深度学习基本技巧选择合适的损失函数平方损失交叉熵损失 … 小批量样本（mini-batch）首先打乱数据，然后选择合适的小批量样本，重复epoch次。例如样本量100，小批量mini-batch样本为20，epoch为10。则先打乱这100个样本，顺序选取20个样本，更新一次参数，然后再选取下20个样本，再更新一次参数，直到把100个样本选取完，这样重复epoch（10
复制链接

扫一扫

专栏目录

评论 4

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。