这节课刘老师主要Logistic回归,Logistic回归与线性回归最大的区别是:线性回归输出的是实数,而Logistic回归输出的是概率分布,所以在输出前加了Sigmoid函数,使得输出的结果满足概率分布。
视频中截图如下:
而损失函数也由之前的MSE改变成了交叉熵(CE),而本节由于用的是二分类问题,只有通过或者不通过,所以用的是BCE(Binary CrossEntropyLoss ),其实BCELoss是CrossEntropyLoss的一个特例,只用于二分类问题,而CrossEntropyLoss可以用于二分类,也可以用于多分类。但是如果是二分类问题,建议BCELoss。
详细代码实现为:
import numpy as np
import torch
import matplotlib.pyplot as plt
import torch.nn.functional as F
#准备数据集
x_data = torch.tensor([[1.0],[2.0],[3.0]])
y_data = torch.tensor([[0.0],[0.0],[1.0]])
# 构造模型
class LogisticRegressionModel(torch.nn.Module):
def __init__(self):
super(LogisticRegressionModel, self).__init__()
self.linear = torch.nn.Linear(in_features=1, out_features=1)
def forward(self, x):
y_pred = F.sigmoid(self.linear(x))
return y_pred
model = LogisticRegressionModel()
#设置损失函数和优化器
BCE_Loss = torch.nn.BCELoss(size_average=False)
Optim = torch.optim.SGD(model.parameters(),lr=0.01)
loss_list = []
#循环训练
for epoch in range(1000):
y_pred = model(x_data)
loss = BCE_Loss(y_pred,y_data)
loss_list.append(loss.item())
Optim.zero_grad()
loss.backward()
Optim.step()
plt.plot(loss_list,color=(0,0.5,0.5))
plt.xlabel('epoch')
plt.ylabel('loss')
plt.show()
x = np.linspace(0,10,200)
x_t = torch.tensor(x).reshape(200,1)
model = model.double()
y_t = model(x_t)
y = y_t.data.numpy()
plt.plot(x,y)
plt.plot([0,10],[0.5,0.5],c='r')
plt.xlabel('Hours')
plt.ylabel('probability of pass')
plt.show()
运行代码后有两个warning
但是不影响代码的运行,可视化结果为:
根据上图不难发现,损失值在1000轮训练后仍然较大,并未达到收敛。
而上图是视频最后按照刘老师的代码所改写后运行得出的结果,而按照刘老师的代码所运行后会报错,
从报错看出是由于数据类型出了些问题,通过改写后,运行无误,得出的结果与刘老师的代码基本一致。