《动手学深度学习》pytorch版笔记2

最新推荐文章于 2024-07-14 17:06:43 发布

qq_23305951

最新推荐文章于 2024-07-14 17:06:43 发布

阅读量111

点赞数

文章标签： pytorch

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_23305951/article/details/104401348

版权

《动手学深度学习》pytorch版笔记2
Task3
过拟合、欠拟合及其解决方案
这部分内容比较简单，写下问题吧，再挖几个坑
1.模型复杂度如何改变，三阶到一阶等
2.L2范数正则化为什么是权重衰减的一种方式？
在这里插入图片描述
梯度消失，梯度爆炸
1.初始化过程
2.标签偏移的概念
3.数据处理过程

循环神经网络进阶
GRU，LSTM中的门结构实现起来还挺复杂的，有空再自己实现一遍吧。另外深度循环神经网络貌似叫多层循环神经网络，印象中一般不会堆叠很多层，有空再研究一下吧

Task4
机器翻译及相关技术
机器翻译是一个多对多的一个过程
1.seq2seq模型training与inference之前的差别（decoder部分），为何会有以及如何实现一直没搞清楚，先挖坑吧
2.Beam search部分以前了解得比较少，就知道贪心算法，需要再研究研究

Attention以及Transformer
这部分应该算是NLP中SOTA算法的基础了，先留下，之后慢慢搞懂

Task5
卷积神经网络基础、LeNet、卷积神经网络进阶
这部分比较熟悉，就放一起了
1.1×1 卷积中，假设我们将通道维当作特征维，将高和宽维度上的元素当成数据样本，那么 1×1 卷积层的作用与全连接层等价？
2.NiN结构没使用Dense层，以前还没注意到这种结构

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
《动手学深度学习》pytorch版笔记2

《动手学深度学习》pytorch版笔记2Task3过拟合、欠拟合及其解决方案这部分内容比较简单，写下问题吧，再挖几个坑1.模型复杂度如何改变，三阶到一阶等2.L2范数正则化为什么是权重衰减的一种方式？梯度消失，梯度爆炸1.初始化过程2.标签偏移的概念3.数据处理过程循环神经网络进阶GRU，LSTM中的门结构实现起来还挺复杂的，有空再自己实现一遍吧。另外深度循环神经网络貌似叫...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。