3D机器学习（7）：MInst数据集实战：一种自己从头开始写，一种利用封装好的代码

最新推荐文章于 2022-10-20 17:56:09 发布

朱攀乖

最新推荐文章于 2022-10-20 17:56:09 发布

阅读量430

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43242161/article/details/100884069

版权

《MInst数据集实战》

1、自己从头开始写

1.1原理解读：

内容：输入28*28=784的数字图片向量，第一个隐藏层将784用矩阵运算压缩到200，第二层不压缩，仍保持200个参数。最后一层提取出10个参数，作为10分类，到底是哪个数字的问题。

第一步：创建网络，创建三个线性层，每个线性层都有参数w和b，注意w和b的矩阵维度，和申明需要梯度计算。因为最后是10分类，所以最后w和b都有10的维度。

第二部：创建预测值x新=relu（x旧*w的转置+b）。

第三部：定义优化器（迭代计算）。

优化目标是三组全连接层的变量w1、w2、w3、b1、b2、b3。
并设置学习率，可设为0.001。
定义loss函数为交叉熵函数。Nn.crossentropyloss与F. cross_entropy功能一样，都已经包含softmax函数了。
定义迭代次数epochs。
Forward函数为之前定义好的网络输出结果，即输出（原始数据data），输出（网络计算过的logits）
这里是调用Nn.crossentropyloss函数，并计算loss（这里把这个函数赋值给了criteon）。输入给loss的是（logit计算的10分类）和（目标的10分类one-hot编码）。

最低0.47元/天解锁文章

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
3D机器学习（7）：MInst数据集实战：一种自己从头开始写，一种利用封装好的代码

《MInst数据集实战》1、自己从头开始写1.1原理解读：内容：输入28*28=784的数字图片向量，第一个隐藏层将784用矩阵运算压缩到200，第二层不压缩，仍保持200个参数。最后一层提取出10个参数，作为10分类，到底是哪个数字的问题。第一步：创建网络，创建三个线性层，每个线性层都有参数w和b，注意w和b的矩阵维度，和申明需要梯度计算。因为最后是10分类，所以最后w和b都...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。