阅读李沐动手学深度学习笔记--第三章

3.8 MLP多层感知机(multilayer perceptron)

  • 多层感知机在输出层与输入层之间加入了一个或多个全连接隐藏层,并通过激活函数对隐藏层输出进行变换。

作者点出在输入和输出层中引入隐藏层其实等价于仅含输出的单层网络,从线性代数的角度理解,隐藏层的添加只是对输入做仿射变换,只有引入非线性函数才会有“质”的不同。我们称这些非线性函数为激活函数:relu sigmoid tanh

防止过拟合的方法:权重衰减+丢弃法(dropout)

3.12 权重衰减

权重衰减等价于 L2​ 范数正则化(regularization),为模型损失函数添加惩罚项使学出的模型参数值较小,是应对过拟合的常用手段

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值