Day3

最新推荐文章于 2022-03-26 15:31:40 发布

m0_46245299

最新推荐文章于 2022-03-26 15:31:40 发布

阅读量75

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_46245299/article/details/104371011

版权

一、过拟合、欠拟合及其解决方案

1.过拟合
（1）定义：模型的训练误差远小于它在测试数据集上的误差。
（2）解决方案：权重衰减、丢弃法、增加训练数据集
2.欠拟合
（1）定义：模型无法得到较低的训练误差。
（2）解决方案：提高模型复杂度

二、梯度消失、梯度爆炸

深度模型有关数值稳定性的典型问题是消失与爆炸。

1.产生原因：当神经网络层数较多时，模型数值稳定性会变差。
2.解决方法：
（1）用ReLu函数代替Sigmoid函数。
（2）在RNN中使用LSTM结构也可以缓解梯度消失。

三、循环神经网络进阶

1、GRU模型

门控循环神经网络可以捕捉时间序列中时间步距离较⼤的依赖关系。
重置⻔有助于捕捉时间序列⾥短期的依赖关系。
更新⻔有助于捕捉时间序列⾥⻓期的依赖关系。
在这里插入图片描述

2、LSTM模型
遗忘门:控制上一时间步的记忆细胞输入门:控制当前时间步的输入
输出门:控制从记忆细胞到隐藏状态
记忆细胞：⼀种特殊的隐藏状态的信息的流动
在这里插入图片描述
3、深度神经网络

4、双向循环神经网络
在这里插入图片描述

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Day3

一、过拟合、欠拟合及其解决方案1.过拟合（1）定义：模型的训练误差远小于它在测试数据集上的误差。（2）解决方案：权重衰减、丢弃法、增加训练数据集2.欠拟合（1）定义：模型无法得到较低的训练误差。（2）解决方案：提高模型复杂度二、梯度消失、梯度爆炸深度模型有关数值稳定性的典型问题是消失与爆炸。1.产生原因：当神经网络层数较多时，模型数值稳定性会变差。2.解决方法：（1）用ReL...
复制链接

扫一扫

m0_46245299 CSDN认证博客专家 CSDN认证企业博客

码龄4年

8: 原创

115万+: 周排名

180万+: 总排名

597: 访问

: 等级

80: 积分

0: 粉丝

0: 获赞

0: 评论

0: 收藏

私信

关注

热门文章

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。