相关知识
1、分类问题不同于线性回归,是输出属于每一个类别的概率。概率最大的就是最后的类别。
2、sigmoid函数
使用sigmoid函数将线性回归里的输出值[-无穷,+无穷]映射到[0,1]。
其他的sigmoid函数:
这些函数满足的条件:
函数值有极限、都是单调的增函数、都是饱和函数。
逻辑回归模型:
损失函数的变化:
这里使用的是交叉熵损失,交叉熵损失描述的的是两个分布之间的差异,越大越好,这里加了一负号,所以是越小越好。
代码
代码部分和线性回归模型差不多还是分为四步。
一、Prepare dataset(准备数据集)
import torch
import numpy as np
import matplotlib.pyplot as plt
# 分类问题:是输出属于每一个类别的概率。概率最大的就是最后的类别。
# 1.Prepare dataset
x_data = torch.Tensor([[1.0], [2.0], [3.0]])
y_data = torch.Tensor([[0], [0], [1]]) # 二分类,输出分成两个类别0和1。最后计算的值是等于0的概率和等于1的概率。
二、Design model using Class(使用类设计模型)
# 二、Design model
class LogisticRegressionModel(torch.nn.Module):
def __init__(self):
super(LogisticRegressionModel, self).__init__()
self.linear = torch.nn.Linear(1, 1)
def forward(self, x):
y_pred = torch.sigmoid(self.linear(x)) # 将线性单元中self.linear(x)算出来的值作为输入送入sigmoid函数中。与线性回归只差多了这一步。
return y_pred
# 模型实例化
model = LogisticRegressionModel()
三、Construct Loss and Optimizer(构造损失函数和优化器)
# 三、Construct Loss and Optimizer
criterion = torch.nn.BCELoss(reduction='sum') # 线性回归中用的是MSELoss,这里用的是BCELoss。
optimizer = torch.optim.SGD(model.parameters(), lr=0.01)
四、Training Cycle(训练循环)
# 四、Training Cycle
for epoch in range(1000):
y_pred = model(x_data)
loos = criterion(y_pred, y_data)
print(epoch, loos.item())
optimizer.zero_grad()
loos.backward()
optimizer.step()
这四步与线性回归基本一致,不一样的地方有:1、数据的输出,不再是输出一个值,而是输出一个类别的概率;2、损失函数的选择,线性回归用的是MSELoss,这里用的是BCELoss;3、在前馈的过程中,需要将线性单元的输出作为输入送入sigmoid函数中(y_pred =torch.sigmoid(self.linear(x))),目的是将实数空间的值映射到0到1之间。
最后测试一下训练好的这个模型。代码如下:
x = np.linspace(0, 20, 200) # 在0到20之间采样200个点
x_t = torch.Tensor(x).view((200, 1)) # view(200, 1)将这200个点变成200行1列的矩阵
y_t = model(x_t) # 计算y_t的值
y = y_t.data.numpy() # 调用numpy()将y_t中的数据拿出来,拿出来的是数组
# 数据可视化
plt.plot(x, y)
plt.plot([0, 20], [0.5, 0.5], c='r') # 画一条0到20的直线,颜色为红色'r',0这一点的为0.5,20这点的值为0.5
plt.xlabel('Hours')
plt.ylabel('Probability of Pass')
plt.grid() # 加网格
plt.show()
结果如图示: