《动手学深度学习》第二次打卡-学习小队

这篇博客介绍了深度学习中常见的问题,包括过拟合、欠拟合及其解决方案,梯度消失和梯度爆炸的原因与对策。还探讨了循环神经网络(RNN)的基础知识,以及在机器翻译中应用的Seq2Seq模型和注意力机制。此外,提到了Transformer模型和卷积神经网络(CNN)的基础概念。
摘要由CSDN通过智能技术生成

一、学习任务:

  • Task03:过拟合、欠拟合及其解决方案;梯度消失、梯度爆炸;循环神经网络进阶
  • Task04:机器翻译及相关技术;注意力机制与Seq2seq模型;Transformer
  • Task05:卷积神经网络基础;leNet;卷积神经网络进阶

二、学习要点

2.1 过拟合、欠拟合及其解决方案

  • 过拟合:太过贴近于训练数据的特征了,在训练集上表现非常优秀,近乎完美的预测/区分了所有的数据,但是在新的测试集上却表现平平
  • 欠拟合:样本不够或者算法不精确,测试样本特性没有学到,不具泛化性,拿到新样本后没有办法去准确的判断
    在这里插入图片描述
    https://blog.csdn.net/xuaho0907/article/details/88649141
  • 解决过拟合:降低数据量,正则化(L1,L2),Dropout(把其中的一些神经元去掉只用部分神经元去构建神经网络)
  • 解决欠拟合:增加训练数据
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值