一、概念
从下面的例子来进行,假设只要得到一定分数就可以看作可以通过考试:
相当于我们不再预测学习4小时可以得到的成绩,而是判断学习4小时是否可以通过考试。
在分类中,模型的输出是输入属于确切类别的概率。
我们可以引入sigmond函数:
可以进行归一化处理,方便我们可以进行相关的分类任务。
Loss Function也发生了上述的变化。
我们也可以使用mini-batch
二、完整代码如下:
import torch
#1.准备数据集
x_data = torch.Tensor([[1.0],[2.0],[3.0],[4.0],[5.0]])
y_data = torch.Tensor([[0],[0],[0],[1],[1]])
#2.设计网络模型
class LogisticRegressionModel(torch.nn.Module):
#初始化
def __init__(self):
super(LogisticRegressionModel,self).__init__()
self.linear = torch.nn.Linear(1,1)
def forward(self,x):
y_pred = torch.sigmoid(self.linear(x))
return y_pred
model = LogisticRegressionModel()
#3.构建损失函数和优化器的选择
criterion = torch.nn.BCELoss(size_average=False) #BCE 交叉熵
optimizer = torch.optim.SGD(model.parameters(),lr=0.01)
#训练
for epoch in range(2000):
y_pred = model(x_data)
loss = criterion(y_pred,y_data)
print(epoch,loss.item())
optimizer.zero_grad()
loss.backward()
optimizer.step()
#测试模型
x_test = torch.Tensor([6])
y_test = model(x_test)
print('y_pred = ',y_test.data)
三、测试模型
import numpy as np
import matplotlib.pyplot as plt
'''
numpy.linspace(start, stop, num=50, endpoint=True, retstep=False, dtype=None)
在指定的间隔内返回均匀间隔的数字。
返回num均匀分布的样本,在[start, stop]。
这个区间的端点可以任意的被排除在外。
'''
x = np.linspace(0,10,200) #在0~10中,均匀取出200个点
#print(x)
x_t = torch.Tensor(x).view(200,1) #将200个点变成(200,1)的张量
#print(x_t)
y_t = model(x_t) #得到y_t是个张量
#print(y_t)
y = y_t.data.numpy() #将y_t张量转化为矩阵形式
#print(y)
plt.plot(x,y)
plt.plot([0,10],[0.5,0.5],c='r')
plt.xlabel('Hours')
plt.ylabel('Probability of Pass')
'''
python可视化---grid()函数
函数功能:绘制刻度线的网格线。
调用签名:plt.grid(linestyle=":", color="r")
linestyle:网格线的线条风格
color:网格线的线条颜色
'''
plt.grid()
plt.show()
运行结果:
参考链接:https://www.bilibili.com/video/BV1Y7411d7Ys?p=6
https://blog.csdn.net/qq_45866407/article/details/108067133