深度学习基础总结

深度学习基本技巧

选择合适的损失函数

  • 平方损失
  • 交叉熵损失

小批量样本(mini-batch)

首先打乱数据,然后选择合适的小批量样本,重复epoch次。例如样本量100, 小批量mini-batch样本为20,epoch为10。则先打乱这100个样本,顺序选取20个样本,更新一次参数,然后再选取下20个样本,再更新一次参数,直到把100个样本选取完,这样重复epoch(10)次。
其他的可以使用随机梯度下降为一个一个的选择样本更新参数,而批量梯度下降使用全部样本更新一次参数。
##使用新的激活函数
常用的为sigmoid, tanh。

ReLU(Rectified Linear Unit)

这里写图片描述

ReLU的变体

LeakyReLU
这里写图片描述

parametric ReLU
这里写图片描述
其中, α \alpha α由梯度下降法学习

#Maxout

这里写图片描述

适应性学习率(adaptive learning rate)

仔细设置学习率,如果学习率偏大,则每次更新后总损失不会下降,而学习率偏小时,训练会很慢。
简单却流行的算法为学习率随着时间变化而减小, η t = η t + 1 \eta^{t} = \frac{\eta}{\sqrt{t+1}} ηt=t+1 η

Adagrad

w ← w − η w ∂

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 4
    评论
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值