二分类logistic回归——平面点分类问题的实现

最新推荐文章于 2023-09-21 20:45:00 发布

Vincent_Weng_

最新推荐文章于 2023-09-21 20:45:00 发布

阅读量693

点赞数

分类专栏：深度学习文章标签： python 机器学习深度学习人工智能

本文链接：https://blog.csdn.net/VincentWeng1/article/details/114371762

版权

深度学习专栏收录该内容

8 篇文章 0 订阅

订阅专栏

二分类logistic回归——平面点分类问题的实现

概述

对于二分类问题，logistic回归的目标是希望找到一个决策边界，将两类区分开来

感知机模型

对于一个输入 $x$ ，如果存在样本点使得 $h_w(x)=\sum_{i=1}^mw_ix_i+b>0$ ，那么判定它的类别为1，否则判定它的类别为0

logistic回归

在感知机模型基础上进行了改进，通过分类概率 $P (Y = 1)$ 与输入 $x$ 之间的关系判别类型。假设一个事件发生的概率为 $P$ ，不发生的概率为 $1 - P$ ，那么定义该事件发生的几率为 $\frac{P}{1-P}$ ，定义 $l o g i t$ 函数为：
$logit(p)=log(\frac{p}{1-p})=w*x+b$
当 $w * x + b$ 的值越接近 $+\infty$ ，几率越接近1，当 $w * x + b$ 越接近 $-\infty$ ，几率越接近0，用这个函数来决定目标属于哪一类

于是，对于训练集数据 $T={(x_1,y_1),(x_2,y_2),...}$ ，假设 $P (Y = 1 ∣ x) = p$ ，那么 $P (Y = 0 ∣ x) = 1 - p$ ，所以似然函数为：
$\prod_{i=1}^np^{y_i}[1-p]^{1-y_i}$
取对数之后得到

$L(w)=\sum_{i=1}^n[y_ilog(p)+(1-y_i)log(1-p)]\\=\sum_{i=1}^n[y_ilog(\frac{p}{1-p})+log(1-p))]\\=\sum_{i=1}^n[y_i(w*x+b)-log(1+e^{w*x+b})]$

之后只需求 $\frac{\partial L(w)}{\partial w}$ 和 $\frac{\partial L(w)}{\partial b}$ 即可反向传播，得到一个网络，输入 $x$ ，输出 $p$

平面点分类问题

平面上有一些点，其中部分属于集合1，部分属于集合0，保证这些点的划分是线性的，现在需要找到一条直线，将属于不同集合的点完美划分在直线两边

分析

使用logistic回归，输入数值对 $x_i,y_i)$ ，输出属于集合1的概率p

如果 $p > 0.5$ 则判定该点属于集合1，否则判定该点属于集合0

代码实现

编译环境：Pytorch3.7

语言：python

首先创建data.txt文件记录各个点的数据：

其中第一列是x坐标，第二列是y坐标，第三列表示所属的集合是1还是0

之后运行如下程序：

import torch
from torch import nn
from matplotlib import pyplot as plt
from torch.autograd import Variable
import numpy as np

# 读取数据
with open('data.txt', 'r') as f:
    data_list = f.readlines()
    data_list = [i.split('\n')[0] for i in data_list]
    data_list = [i.split(',') for i in data_list]
    data = [(float(i[0]), float(i[1]), float(i[2])) for i in data_list]
x_data = [(float(i[0]), float(i[1])) for i in data]
y_data = [(float(i[2])) for i in data]
x_data = torch.Tensor(x_data)
y_data = torch.Tensor(y_data)
y_data = y_data.view(10, 1)
x0 = list(filter(lambda x: x[-1] == 0.0, data))
x1 = list(filter(lambda x: x[-1] == 1.0, data))
plot_x0_0 = [i[0] for i in x0]
plot_x0_1 = [i[1] for i in x0]
plot_x1_0 = [i[0] for i in x1]
plot_x1_1 = [i[1] for i in x1]
plt.plot(plot_x0_0, plot_x0_1, 'ro', label='x_0')
plt.plot(plot_x1_0, plot_x1_1, 'bo', label='x_1')
plt.legend(loc='best')


# 定义logistic模型
class LogisticRegerssion(nn.Module):
    def __init__(self):
        super(LogisticRegerssion, self).__init__()
        self.mode = nn.Linear(2, 1)
        self.sm = nn.Sigmoid()

    def forward(self, x):
        x = self.mode(x)
        x = self.sm(x)
        return x

#构造网络、优化器、损失函数
logistic_model = LogisticRegerssion()
criterion = nn.BCELoss()
optimizer = torch.optim.SGD(logistic_model.parameters(), lr=1e-3, momentum=0.9)

#开始训练
for epoch in range(50000):
    x = Variable(x_data)
    y = Variable(y_data)
    # forward
    out = logistic_model(x)
    loss = criterion(out, y)
    print_loss = loss.data
    mask = out.ge(0.5).float()
    correct = (mask == y).sum()
    acc = correct.data / x.size(0)
    # backward
    optimizer.zero_grad()
    loss.backward()
    optimizer.step()
    if (epoch + 1) % 1000 == 0:
        print('epoch {} loss {} acc {}'.format(epoch + 1, print_loss, acc))

#取出参数，绘制直线
w0, w1 = logistic_model.mode.weight[0]
w0 = w0.data
w1 = w1.data
b = logistic_model.mode.bias.data[0]
plot_x = np.arange(0, 4, 0.1)
plot_y = (-w0 * plot_x - b) / w1
plt.plot(plot_x, plot_y)
plt.show()

得到结果：

可以看到找到了一条直线划分了属于不同集合的点。

Vincent_Weng_

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
二分类logistic回归——平面点分类问题的实现

二分类logistic回归——平面点分类问题的实现概述对于二分类问题，logistic回归的目标是希望找到一个决策边界，将两类区分开来感知机模型对于一个输入xxx，如果存在样本点使得hw(x)=∑i=1mwixi+b>0h_w(x)=\sum_{i=1}^mw_ix_i+b>0hw(x)=∑i=1mwixi+b>0，那么判定它的类别为1，否则判定它的类别为0logistic回归在感知机模型基础上进行了改进，通过分类概率P(Y=1)P(Y=1)P(Y=1)与输入xxx之间
复制链接

扫一扫

专栏目录