softmax回归
一:分类问题
softmax回归跟线性回归一样将输入特征与权重做线性叠加。与线性回归的一个主要不同在于,softmax回归的输出值个数等于标签里的类别数。
这里我们可以考虑一个简单的图像分类问题,假设输入图像高和宽均为2像素,色彩为灰度。我们将图像中的4像素分别记为X1,X2,X3,X4。假设训练数据集中图像的真实标签为数字1,2,3(假设可以用4像素表示出这3种数字),这些标签分别对应离散值y1,y2,y3。如此,一张图像的lable为1,2和3这些数值中的一个。
这里可参照之前的一篇博文:基于MXNet框架实现手写字体识别
二:softmax回归模型
softmax回归的输出值个数等于标签里的类别数。因为一共有4种特征和3种输出数字类别,所以权重包含12个标量(带下标的w),偏差包含3个标量(带下标的b),每个输入计算出O1,O2,O3这三种输出。
三:模型实现
1.首先导入本节实现所需的包或模块
(备注:以下代码实现基于MXNet框架)
import d2lzh as d2l
from mxnet import autograd, nd
这里使用到d2lzh包,需要提前安装好。
2.获取数据
batch_size = 256
train_iter