逻辑回归（Logistic regression）详解-并用scikit-learn训练逻辑回归拟合Iris数据集

最新推荐文章于 2024-08-05 17:02:14 发布

Xurtle

最新推荐文章于 2024-08-05 17:02:14 发布

阅读量9.3w

点赞数 37

分类专栏：机器学习机器学习算法文章标签：逻辑回归机器学习

本文链接：https://blog.csdn.net/xlinsist/article/details/51289825

版权

本文深入解析逻辑回归的逻辑函数、最大似然估计及成本函数，通过scikit-learn训练逻辑回归模型，并在Iris数据集上进行实战，展示模型的决策边界。同时强调理解算法原理对于模型调试的重要性。

摘要由CSDN通过智能技术生成

引言

这篇文章主要介绍逻辑回归背后的一些概率概念，给你一些直观感觉关于它的代价函数的由来。并且我也介绍了关于最大似然估计（maximum likelihood）的概念，用这个强大的工具来导出逻辑回归的cost函数。接着，我用scikit-learn训练了感知机模型来让你熟悉scikit-learn，最后用scikit-learn来训练逻辑回归，并作出决策边界图，效果还算不错。

逻辑函数(logistic function)

为了更好地解释逻辑回归，让我们首先了解一下逻辑函数。逻辑函数由于它的S形，有时也被称为sigmoid函数。

现在我要引入比值比（odds ratio）的概念，它可以被写成 $\frac{p}{(1 - p)}$ ，其中的 $p$ 代表正事件（positive event）的概率，正事件并不是代表好的方面的概率，而是代表我们想要预测的事件。比如：病人患有某种疾病的概率。我们把正事件的类标签设置为1。比值比的对数称为Logit函数，它可以写成如下形式：

l o g i t (p) = l o g p ( 1 - p )

$logit(p) = log\frac{p}{(1 - p)}$

它的函数图像如下：

Logit函数

图片来源 https://en.wikipedia.org/wiki/Logit#/media/File:Logit.svg

从图像上我们可以看出，logit函数输入0到1的值并把它们转换为整个实数范围内的值。上面的 $p$ 代表正事件的概率，因此在给定特征向量 $x$ 的条件下，类别 $y = 1$ 的概率可以写成 $P(y = 1 | x)$ 。大家都知道概率的范围为0到1，如果我把这个概率传递给logit函数那么它的输出范围是整个实数，因此如果我用某些合适的权重向量 $w$ 参数化特征向量 $x$ 后，可以有如下等式：

l o g i t (P (y = 1 | x)) = w 0 x 0 + w 1 x 1 + \dots + w n x n = \sum i = 0 n w i x i

$logit\left( P(y = 1 | x) \right) = w_0x_0 + w_1x_1 + \dots + w_nx_n = \sum_{i = 0}^{n}w_ix_i$

但是在实际应用中，我们更想求的是 $P(y = 1 | x)$ ，因此，我们需要找到logit函数的反函数，通过输入用权重向量 $w$ 来参数化的 $x$ ，来输出我们想要知道的正事件的概率，即 $P(y = 1 | x)$ 。而这个反函数就是我们的sigmoid函数，它可以写成 $S(h) = \frac{1}{1 + e^{-h}}$ ，公式中的 $h$ 为样本特征和权重的线性组合，即， $w_0x_0 + w_1x_1 + \dots + w_nx_n$ 。下面我们来画出这个函数图像的样子：

import matplotlib.pyplot as plt
import numpy as np

def sigmoid(h):
    return 1.0 / (1.0 + np.exp(-h))

h = np.arange(-10, 10, 0.1) # 定义x的范围，像素为0.1
s_h = sigmoid(h) # sigmoid为上面定义的函数
plt.plot(h, s_h)
plt.axvline(0.0, color='k') # 在坐标轴上加一条竖直的线，0.0为竖直线在坐标轴上的位置
plt.axhspan(0.0, 1.0, facecolor='1.0', alpha=1.0, ls='dotted') # 加水平间距通过坐标轴
plt.axhline(y=0.5, ls='dotted', color='k') # 加水线通过坐标轴
plt.yticks([0.0, 0.5, 1.0]) # 加y轴刻度
plt.ylim(-0.1, 1.1) # 加y轴范围
plt.xlabel('h')
plt.ylabel('$S(h)$')
plt.show()