伯禹ElitesAI·动手学深度学习PyTorch版——task03

一、循环神经网络进阶——处理梯度较容易出现衰减或爆炸(BPTT)问题

1.GRU(重置⻔、更新⻔)

2.LSTM(遗忘门、输入门、输出门、记忆细胞)

3.深度循环神经网络——用上一层的输出作为下一层的输入

4.双向循环神经网络——考虑前后的值对它的影响

二、过拟合和欠拟合

1.欠拟合:模型无法得到较低的训练误差

2.过拟合:模型的训练误差远小于它在测试数据集上的误差

模型复杂度低容易造成欠拟合,高容易造成过拟合

数据集太小容易造成过拟合

解决过拟合的方法:权重衰减(L2 范数正则化)和丢弃法

三、

1.梯度消失和梯度爆炸——当层数较多时,梯度的计算也容易出现消失或爆炸

2.随机初始化模型参数

(1)PyTorch的默认随机初始化——线性主要使用正态分布的随机初始化方式

(2)Xavier随机初始化

3.考虑环境因素

(1)协变量偏移——样本发生本质改变,标签不变

(2)标签偏移 ——测试集中出现训练集没有的标签

(3)概念偏移——一个单词包含不同概念

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值