3/11 笔记

最新推荐文章于 2024-07-12 16:21:48 发布

诗酒趁年华sustech

最新推荐文章于 2024-07-12 16:21:48 发布

阅读量70

点赞数

文章标签：深度学习人工智能 Powered by 金山文档

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lmq280492/article/details/129476484

版权

Deep Learning

PyTorch 参数矩阵初始化

self.weight = nn.Parameter(torch.Tensor(inputsize, hiddensize))
nn.init.xavier_uniform_(self.weight)

PyTorch bias 初始化

self.bias = nn.Parameter(torch.Tensor(hiddensize))
nn.init.zeros_(self.bias)

ReLU 会导致更多的梯度爆炸，因为会保留正值，当权重非常大的时候，梯度就会变得非常大

tanh 会导致梯度消失，因为当值非常大的时候，tanh 的导数趋近于零，累积则会产生梯度消失，这一问题可以通过增强梯度信号进行解决

标签平滑(label smoothing)会使得真实类标签与错误类标签之间界限区域模糊，从而提高模型的泛化能力，减少模型在训练过程中的所需训练参数，减少模型与真实值之间的误差，使得模型更加快速地进行收敛。

transpose convolution 算法，相当于卷积逆过程，将 Input 的每个元素分别乘以 filter 的每个元素，并且不断扫描排列。

卷积 layer 相对于全连接的优点：权重共享，translation invariance.

诗酒趁年华sustech

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
3/11 笔记

Berkeley 3/11 note
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。