深度学习激活函数和权值初始化

激活函数选择总结

         尽量选择ReLU函数或者Leakly ReLU函数,相对于Sigmoid/tanh,ReLU函数或者Leakly ReLU函数会让梯度流更加顺畅,训练过程收敛得更快。

权值初始化总结

        好的初始化方法可以防止前向传播过程中的信息消失,也可以解决反向传递过程中的梯度消失。

        激活函数选择双曲正切或者Sigmoid时,建议使用Xaizer初始化方法;

        激活函数选择ReLU或Leakly ReLU时,推荐使用He初始化方法。

过拟合现象

        出现过拟合,得到的模型在训练集上的准确率很高,但在真实的场景中识别率确很低。

过拟合与欠拟合

        过拟合——是指学习时选择的模型所包含的参数过多,以至于出现这一模型对已知数据预测的很好,但对未知数据预测得很差的现象。这种情况下模型可能只是记住了训练集数据,而不是学习到了数据特征。

        欠拟合——模型描述能力太弱,以至于不能很好地学习到数据中的规律。产生欠拟合的原因通常是模型过于简单。

机器学习的根本问题是优化和泛化问题

        优化——是指调节模型以在训练数据上得到最佳性能;

        泛化——是指训练好的模型在前所未见的数据上的性能好坏。

应对过拟合

        最优方案——获取更多的训练数据

        次优方案——调节模型允许存储的信息量或者对模型允许存储的信息加以约束,该类方法也称为正则化。

                调节模型大小

                约束模型权重,即权重正则化(常用的有L1、L2正则化)

                随机失活(Dropout)

神经网络中的超参数

超参数:网络结构——隐层神经元个数,网络层数,非线性单元选择等

              优化相关——学习率、dropout比率、正则项强度等

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
深度学习中,神经网络的权重初始化方法对模型的收敛速度和性能有着至关重要的影响。一个好的权重初始化方法可以帮助解决梯度消失和梯度爆炸的问题,并且有利于模型的性能和收敛速度。 在当前的深度学习中,隐藏层常使用ReLU作为激活函数,并且常用的权重初始化方法是He initialization。这种初始化方法通过根据ReLU的特性,将权重初始化为均值为0,标准差为sqrt(2/n)的高斯分布,其中n是上一层神经元的数量。这种方法在实践中显示出比Xavier initialization更好的效果。 当然,除了He initialization之外,还有其他几种常用的权重初始化方法,如Xavier initialization和正交初始化等。这些方法根据不同的特性和需求,在不同的情况下可能会有更好的效果。 总之,权重初始化深度学习中的重要步骤之一,它对模型的性能和收敛速度有着重要的影响,而He initialization是当前深度学习中常用的神经网络权重初始化方法之一。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* *3* [深度学习中神经网络的几种权重初始化方法](https://blog.csdn.net/Harrytsz/article/details/120840148)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 100%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值