sklearn中的逻辑回归

最新推荐文章于 2024-06-12 20:59:02 发布

momokofly

最新推荐文章于 2024-06-12 20:59:02 发布

阅读量2.3k

点赞数 2

分类专栏：机器学习文章标签：逻辑回归 sklearn 机器学习

本文链接：https://blog.csdn.net/momokofly/article/details/121740384

版权

1 概述

1.1 名为“回归”的分类器

逻辑回归是一种名为“回归”的线性分类器，它的本质是由线性回归变化而来的，一种广泛使用于分类问题中的广义回归算法。要理解逻辑回归从何而来，得先理解线性回归。线性回归是机器学习中最简单的回归算法，写作一个几乎人人熟悉的方程：
$z=a_0+a_1x_1+a_2x_2+...+a_nx_n$
其中， $a$ 被统称为模型的参数，其中 $a_0$ 被称为截距（intercept）， $a_1$ ~ $a_n$ 被称为系数（coefficient）。使用矩阵来表示这个方程，其中 $x$ 和 $a$ 都可以被看做时一个列矩阵，则有：
$z=\begin{pmatrix}a_0&a_1&a_2&...&a_n\end{pmatrix}*\begin{pmatrix}x_0\\x_1\\x_2\\...\\x_n\end{pmatrix}=\textbf{a}^T\textbf{x}(x_0=1)$
线性回归的任务，就是构造一个预测函数 $z$ 来映射输入的特征矩阵 $x$ 和标签值 $y$ 的线性关系，而构造预测函数的核心就是找出模型的参数： $a^T$ 和 $a_0$ ，著名的最小二乘法就是用来求解线性回归中参数的数学方法。
通过函数 $z$ ，线性回归使用输入的特征矩阵 $x$ 来输出一组连续型的标签值y_pred，以完成各种预测连续型变量的任务（如预测产品销量，预测股价等）。如果标签是离散型变量，尤其是，如果是满足0-1分布的离散型变量，可以通过引入联系函数（link function），将线性回归方程 $z$ 变换为 $g (z)$ ，并且令 $g (z)$ 的值分布在 $(0, 1)$ 之间，且当 $g (z)$ 接近为0时样本的标签为类别0，当 $g (z)$ 接近为1时样本的标签为类别1，这样就得到一个分类模型，而这个联系函数对于逻辑回归来说，就是Sigmoid函数：
$g(z)=\frac{1}{1+e^{-z}}$
Sigmoid函数的公式和性质：Sigmoid函数是一个S型的函数，当自变量 $z$ 趋近正无穷时，因变量 $g (z)$ 趋近于1，而当 $z$ 趋近负无穷时， $g (z)$ 趋近于0，它能够将任何实数映射到 $(0, 1)$ 区间，使其可用于将任意值函数转换为更适合二分类的函数。因为这个性质，Sigmoid函数也被当作是归一化的一种方法，与之前学过的MinMaxScaler同理，是属于数据预处理中的“缩放”功能，可以将数据压缩到 $[0, 1]$ 之内。区别在于，MinMaxScaler归一化之后，是可以取到0和1的（最大值归一化后就是1，最小值归一化后就是0），但Sigmoid函数只是无限趋近于0和1。
线性回归中 $z=\textbf{a}^T\textbf{x}$ ，将 $z$ 带入，就得到了二元逻辑回归模型的一般形式：
$g(z)=y(x)=\frac{1}{1+e^{-\textbf{a}^T\textbf{x}}}$
而 $g (z)$ 就是逻辑回归返回的标签值。此时， $y (x)$ 的取值都在 $[0, 1]$ 之间，因此 $y (x)$ 和 $1 - y (x)$ 相加必然为1。如果令 $y (x)$ 除以 $1 - y (x)$ 可以得到形似几率（odds）的 $\frac{y(x)}{1-y(x)}$ ，在此基础上取对数，可以很容易得到：
$ln\frac{y(x)}{1-y(x)}=ln(\frac{\frac{1}{1+e^{-\textbf{a}^T\textbf{x}}}}{1-\frac{1}{1+e^{-\textbf{a}^T\textbf{x}}}})=ln(\frac{\frac{1}{1+e^{-\textbf{a}^T\textbf{x}}}}{\frac{e^{-\textbf{a}^T\textbf{x}}}{1+e^{-\textbf{a}^T\textbf{x}}}})=ln(\frac{1}{e^{-\textbf{a}^T\textbf{x}}})=ln(e^{\textbf{a}^T\textbf{x}})=\textbf{a}^T\textbf{x}$
不难发现， $y (x)$ 的形似几率对数的本质其实就是线性回归 $z$ ，实际上是在对线性回归模型的预测结果取对数几率来让其结果无限逼近0和1。因此，其对应的模型被称为“对数几率回归”（logistic regression），也就是逻辑回归，这个名为“回归”的模型是用来做分类工作的分类器。
线性回归的核心任务是通过求解 $\textbf{a}$ 构建 $z$ 这个预测函数，并希望预测函数 $z$ 能够尽量拟合数据，因此逻辑回归的核心任务也是类似的：求解 $\textbf{a}$ 来构建一个能够尽量拟合数据的预测函数 $y (x)$ ，并通过向预测函数中输入特征矩阵来获取相应的标签值 $y$ 。
思考： $y (x)$ 代表了样本为某一类标签的概率吗？： $ln\frac{y(x)}{1-y(x)}$

最低0.47元/天解锁文章

momokofly

关注

2
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
sklearn中的逻辑回归

1 概述1.1 名为“回归”的分类器逻辑回归是一种名为“回归”的线性分类器，它的本质是由线性回归变化而来的，一种广泛使用于分类问题中的广义回归算法。要理解逻辑回归从何而来，得先理解线性回归。线性回归是机器学习中最简单的回归算法，写作一个几乎人人熟悉的方程：z=a0+a1x1+a2x2+...+anxnz=a_0+a_1x_1+a_2x_2+...+a_nx_nz=a0+a1x1+a2x2+...+anxn其中，aaa被统称为模型的参数，其中a0a_0a0被称为截距（intercept
复制链接

扫一扫