《动手学深度学习》pytorch版笔记2

《动手学深度学习》pytorch版笔记2
Task3
过拟合、欠拟合及其解决方案
这部分内容比较简单,写下问题吧,再挖几个坑
1.模型复杂度如何改变,三阶到一阶等
2.L2范数正则化为什么是权重衰减的一种方式?
在这里插入图片描述
梯度消失,梯度爆炸
1.初始化过程
2.标签偏移的概念
3.数据处理过程

循环神经网络进阶
GRU,LSTM中的门结构实现起来还挺复杂的,有空再自己实现一遍吧。另外深度循环神经网络貌似叫多层循环神经网络,印象中一般不会堆叠很多层,有空再研究一下吧

Task4
机器翻译及相关技术
机器翻译是一个多对多的一个过程
1.seq2seq模型training与inference之前的差别(decoder部分),为何会有以及如何实现一直没搞清楚,先挖坑吧
2.Beam search部分以前了解得比较少,就知道贪心算法,需要再研究研究

Attention以及Transformer
这部分应该算是NLP中SOTA算法的基础了,先留下,之后慢慢搞懂

Task5
卷积神经网络基础、LeNet、卷积神经网络进阶
这部分比较熟悉,就放一起了
1.1×1 卷积中,假设我们将通道维当作特征维,将高和宽维度上的元素当成数据样本,那么 1×1 卷积层的作用与全连接层等价?
2.NiN结构没使用Dense层,以前还没注意到这种结构

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值