softmax简单实现

最新推荐文章于 2024-07-25 16:58:58 发布

SkaWxp

最新推荐文章于 2024-07-25 16:58:58 发布

阅读量1k

点赞数 1

分类专栏：深度学习文章标签：深度学习 softmax 动手学深度学习 gluon mxnet

本文链接：https://blog.csdn.net/weixin_42749049/article/details/100169434

版权

本文介绍了softmax回归的实现过程，包括数据获取、模型初始化、模型定义、损失函数设计、模型训练和预测。通过Fashion-MNIST数据集，详细解释了softmax函数如何确保输出为合法概率分布，并探讨了在实践中可能遇到的问题，如数值稳定性。同时，文章还讨论了交叉熵损失函数的实现及其可能存在的问题，并提出了相应的解决方案。

摘要由CSDN通过智能技术生成

softmax连接输入输出的模型中，输出需要每个类别的概率

线性回归中，我们只需要输出靠近目标值——就是函数结果
输出是yhat

softmax的简单实现

import d2lzh as d2l
from mxnet import autograd, nd

获取和读取数据

选取数据集：⽤Fashion-MNIST
设置迭代的批量

batch_size = 256
train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size)

初始化模型参数

输入：单个图像的像素值 $28 * 28 = 784$
输出：10个类别
所以softmax回归的权重weight为 $784 * 10$ 的矩阵；偏差参数bias为 $1 * 10$ 的矩阵
还是用NdArray的随机正太函数填满初始化矩阵

最后为模型参数附上梯度

num_inputs = 784
num_outputs = 10
W = nd.random.normal(scale=0.01, shape=(num_inputs, num_outputs))
b = nd.zeros(num_outputs)

W.attach_grad()
b.attach_grad()

定义模型

模型就是

最低0.47元/天解锁文章

SkaWxp

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
softmax简单实现

softmax连接输入输出的模型中，输出需要每个类别的概率线性回归中，我们只需要输出靠近目标值——就是函数结果输出是yhat文章目录softmax的简单实现获取和读取数据初始化模型参数定义模型定义损失函数训练模型预测softmax回归的简洁实现softmax的简单实现import d2lzh as d2lfrom mxnet import autograd, nd获取和读取数据选...
复制链接

扫一扫

专栏目录