一、概念:
对于之前的线性问题转化成分类问题:如果不再预测学习4小时可以得到的成绩,而是判断学习4小时是否可以通过考试。
线性回归模型的模型和损失:
那么,分类问题如何将结果映射到[0,1]
呢?引出了sigmoid函数,将y带入x即可。
计算某输入属于某一输出的概率的最大值。
σ函数:保证输出值在0~1之间
损失函数称为:BCE Loss(Cross Entropy 交叉熵)
二、代码:
import torch
# 准备数据集
x_data = torch.Tensor([[1.0], [2.0], [3.0]])
y_data = torch.Tensor([[0], [0], [1]])
# 设计网络模型
class LogisticRegressionModel(torch.nn.Module):
def __init__(self):
super(LogisticRegressionModel, self).__init__()
self.linear = torch.nn.Linear(1, 1) # 两个参数分别为w和b
def forward(self, x):
y_pred = torch.sigmoid(self.linear(x))
return y_pred
model = LogisticRegressionModel()
# Construct Loss and optimizer
criterion = torch.nn.BCELoss(reduction='sum')
optimizer = torch.optim.SGD(model.parameters(), lr = 0.01)
# Training cycle
for epoch in range(2000):
y_pred = model(x_data)
loss = criterion(y_pred, y_data)
# print(epoch, loss.item())
optimizer.zero_grad()
loss.backward()
optimizer.step()
x_test = torch.Tensor([1.0])
y_test = model(x_test)
print("y_pred = ", y_test.data)
实验结果截图:
三、问题:
如果用课上的代码出现如下错误,说明是版本迭代,参数发生了改变。图上表明size_average
可以使用reduction = sum
。
以及nn.functional.sigmoid
被弃用,改成了torch.sigmoid
。
四、可视化:
import numpy as np
import matplotlib.pyplot as plt
'''
numpy.linspace(start, stop, num=50, endpoint=True, retstep=False, dtype=None)
在指定的间隔内返回均匀间隔的数字。
返回num均匀分布的样本,在[start, stop]。
这个区间的端点可以任意的被排除在外。
'''
x = np.linspace(0,10,200) #在0~10中,均匀取出200个点
# print(x)
x_t = torch.Tensor(x).view(200,1) #将200个点变成(200,1)的张量
# print(x_t)
y_t = model(x_t) #得到y_pred_t是个张量
# print(y_t)
y = y_t.data.numpy() #将y_pred_t张量转化为矩阵形式
# print(y)
plt.plot(x,y)
plt.plot([0,10],[0.5,0.5],c='r')
plt.xlabel('Hours')
plt.ylabel('Probability of Pass')
plt.grid()
plt.show()