def softmax(X):
X_exp = torch.exp(X)
partition = X_exp.sum(1, keepdim=True)
return X_exp / partition # 这里应用了广播机制
def net(X):
return softmax(torch.matmul(X.reshape((-1, W.shape[0])), W) + b)
#softmax回归模型。 代码定义了输入如何通过网络映射到输出。 注意,将数据传递到模型之前,我们使用reshape函数将每张原始图像展平为向量。
def evaluate_accuracy(net, data_iter): #@save
"""计算在指定数据集上模型的精度"""
if isinstance(net, torch.nn.Module):
net.eval() # 将模型设置为评估模式
metric = Accumulator(2) # 正确预测数、预测总数
with torch.no_grad():
for X, y in data_iter:
metric.add(accuracy(net(X), y), y.numel())
return metric[0] / metric[1]
metric.add(accuracy(net(X), y), y.numel())
y.numel() 代表所有预测值,也就是总的输入数据个数(图片个数)
accuracy(net(X), y)
accuracy这个函数,目的是得到预测正确的数目
def accuracy(y_hat, y): #@save
"""计算预测正确的数量"""
if len(y_hat.shape) > 1 and y_hat.shape[1] > 1:
y_hat = y_hat.argmax(axis=1)
cmp = y_hat.type(y.dtype) == y
return float(cmp.type(y.dtype).sum())
net(X) 是上面定义的softmaxt回归模型
y是一个张量,里面放的是正确的预测值,例如:y = torch.tensor([0, 2]),也就是第一个图片是第0类,第二个图片是第2类
可以理解为
net(x):
[0.6,0.2,0.1,0.1
0.1,0.2,0.65,0.05
0.1,0.8,0.05,0.05
0.1,0.05,0.750.1
]
y:
[0,1,1,2]
net(x):
[0.6,0.2,0.1,0.1
0.1,0.2,0.65,0.05 arccuracy 函数 argmax 找到最大 [0.6,0.65,0.8,0.75]
0.1,0.8,0.05,0.05 对应类别 [ 0 , 2 , 1 , 2]
0.1,0.05,0.75,0.1
]
得到的 [ 0 , 2 , 1 , 2] 和
y: [0 , 1 , 1 , 2]
比较,正确数量为 3 个
然后 写入 metric.add(accuracy(net(X), y), y.numel()) 中
最后哦
return metric[0] / metric[1]