深度学习之——MLP实现

最新推荐文章于 2023-12-17 22:10:23 发布

Shudsa

最新推荐文章于 2023-12-17 22:10:23 发布

阅读量221

点赞数

文章标签：深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Shudsa/article/details/134386929

版权

多层感知机的从零开始实现

单隐藏层的含义与作用：隐藏层的意义就是把输入数据的特征，抽象到另一个维度空间，来展现其更抽象化的特征，这些特征能更好的进行线性划分。

多隐藏层的含义：多个隐藏层其实是对输入特征多层次的抽象，最终的目的就是为了更好的线性划分不同类型的数据（隐藏层的作用）。

前提：

导入PyTorch库与nn模块与d2l包；解压数据文件（使用以！开头的Shell命令来解压和移动数据集文件；如：!tar -xf Datasets.tar：使用"tar"命令解压缩名为"Datasets.tar"的文件，将其中的内容提取出来。）；使用d2l包中的函数d2l.load_data_fashion_mnist 函数来加载 FashionMNIST 数据集并创建返回训练和测试数据迭代器

初始化模型参数

num_inputs, num_outputs, num_hiddens= 784, 10, 64表示设置输入层大小为784，输出层大小为10，隐藏层大小为64（隐藏层的大小决定了神经网络中每个隐藏层单元的数量。较大的隐藏层大小可以增加网络的容量，使其能够更好地拟合训练数据。然而，设置过大的隐藏层大小可能导致模型过度拟合训练数据，从而在未见过的数据上表现较差。）

W1 = nn.Parameter(torch.randn(

num_inputs, num_hiddens, requires_grad=True) * 0.01)

W2 = nn.Parameter(torch.randn(

num_hiddens, num_outputs, requires_grad=True) * 0.01)

这两行代码分别定义了输出层到隐藏层的权重参数W1与隐藏层到输出层的权重参数W2，都采用正态分布初始化，启用梯度计算。

b1，b2则分别定义为隐藏层的偏置参数与输出层的偏置参数。

激活参数

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
深度学习之——MLP实现

多层感知机相较于之前的线性回归实现，能够展现更多的抽象特征，从多方面来进行训练模型，预测实验结果，学会了用不同的激活函数与不同的初始化权重方案来改善训练模型，以达到最优的结果。该函数的输入为一个张量X，表示隐藏层的输出，使用 torch.zeros_like(X) 创建一个与 X 维度相同的全零张量 a，然后使用 torch.max(X, a) 对 X 和 a 进行逐元素的比较，这样实现了ReLU函数的功能：将小于0的元素设为0，其余元素不变。训练的论述与Ir学习率的大小来控制训练的实现过程。
复制链接

扫一扫

Shudsa CSDN认证博客专家 CSDN认证企业博客

码龄1年

15: 原创

141万+: 周排名

20万+: 总排名

4554: 访问

: 等级

187: 积分

18: 粉丝

37: 获赞

7: 评论

26: 收藏

私信

关注

热门文章

最新评论

机器学习之——支持向量机
CSDN-Ada助手: 首先恭喜您写了第15篇关于机器学习支持向量机的博客，您对这个领域的深入研究和总结让人印象深刻。接下来，我建议您可以考虑在博客中加入一些实际案例或者应用场景，这样可以帮助读者更好地理解支持向量机的实际应用。同时也希望您能继续坚持创作，分享更多有价值的内容，期待您的下一篇博客！
深度学习之——目标检测基础
CSDN-Ada助手: 恭喜你写了第12篇博客！你对深度学习目标检测的基础知识有着很好的理解，文章内容清晰易懂，让我受益匪浅。希望你可以继续保持创作的热情，可以考虑写一些深度学习目标检测的实际应用案例，或者深入探讨一些相关算法的原理，这样可以让读者更加全面地了解这个领域。期待你的下一篇作品！
深度学习之线性回归实现
CSDN-Ada助手: 恭喜您撰写了关于深度学习中线性回归实现的博客，内容详实，让人受益匪浅。希望您能继续分享更多关于深度学习的知识，比如其他常见的模型或者实际应用案例，这样可以让更多人受益。期待您的下一篇作品！
深度学习之——MLP实现
CSDN-Ada助手: 恭喜你在博客上分享了关于深度学习中MLP实现的文章！我非常欣赏你对这个话题的深入探讨和分享。不过在下一篇博客中，我希望你可以进一步深入探讨MLP实现中的一些挑战和解决方案，这样可以为读者提供更多有用的信息。期待你的下一篇精彩文章！
基于hough变换的图像边缘提取
CSDN-Ada助手: 恭喜作者在博客中分享了基于hough变换的图像边缘提取的内容，这是一个非常有趣和实用的技术。希望作者能够继续坚持创作，分享更多关于图像处理和计算机视觉方面的知识。或许下一步可以探讨一些实际案例，展示如何将这些技术运用到实际项目中，让读者更好地理解和应用。期待作者的下一篇作品！

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。