史上最直白的logistic regression教程之一

最新推荐文章于 2024-07-15 14:46:23 发布

未济2019

最新推荐文章于 2024-07-15 14:46:23 发布

阅读量2.3w

点赞数 17

分类专栏：深度学习

本文链接：https://blog.csdn.net/lizhe_dashuju/article/details/49864569

版权

本文作为Logistic Regression教程的一部分，旨在通过简单问题介绍该算法的基础。Logistic Regression用于分类，通过Logistic函数将连续预测值限制在[0,1]之间。文章强调了理解并实践推导过程的重要性，并指出Google Ads使用类似模型。作者从线性拟合开始，逐步引入误差函数和梯度下降法，为后续的优化问题和实际应用奠定基础。" 123097477,10759251,SQL函数查询实践与技巧,"['数据库', 'SQL查询', '数据操作', '子查询', '表管理']

摘要由CSDN通过智能技术生成

本系列前四篇是随手涂鸦，只为讲清问题，有口语化，且有少数符号误写，以及重复絮叨，且不打算修改：）第5篇提供了一个严谨的学术语言的完整pdf文档，敬请下载！

Logistic Regession是什么

Logistic Regression是线性回归，但最终是用作分类器：它从样本集中学习拟合参数，将目标值拟合到[0,1]之间，然后对目标值进行离散化，实现分类。

为什么叫Logistic呢？因为它使用了Logisitic函数，形如：

f (z) = e z e z + 1 = 1 1 + e - z

$f(z) = \dfrac{e^z}{e^z+1} = \dfrac{1}{1+e^{-z}}$
这个函数有一些很有趣的性质，后面会谈到。

Logistic regression有一定的复杂度。对新人来说，最好有一个完整的推导指南，然后反复推导N遍(N>=5)，直至能独立推导，再用python或者java实现这个推导，然后用这个实现解决一个实际应用，这样差不多算是掌握Logistic regression了。上述过程缺一不可，而且是成本最小的学习方案。

Logistic regression很重要，据说google的Ads广告使用的预测算法就是一个大Logistic regression模型。

Logistic regression涉及机器学习的多个重要概念，样本集，特征，向量，损失函数，最优化方法，梯度下降。如果对logistic regression能做到庖丁屠牛的程度，对未来进行模式识别和机器学习有事半功倍的收益。

我们现从一个最简单的问题开始，然后逐步增加功能，最终实现logistic regression。

先从一个最简单的问题开始

假如有一组样本，形如

{x 1, y 1}, {x 2, y 2}, . . ., {x i, y i}, . . . {x n, y n} [1]

$\{x_1, y_1\}, \{x_2, y_2\}, ..., \{x_i, y_i\}, ...\{x_n, y_n\} [1]$

xi $x_i$ 的值决定

yi $y_i$ 的值，也就是说

xi $x_i$ 是自变量，

yi $y_i$ 是因变量，每个

xi $x_i$ 对应一个

yi $y_i$ 。从脚标可以看出，这组样本一共有

n $n$ 个。

$x_i$ 是一个向量，也就是说， $x_i$ 里有多个元素，也就是可以表示为

x i = [x i, 1, x i, 2, . . ., x i, j, . . . x i, k] T [2]

$x_i = [x_{i, 1},x_{i,2}, ..., x_{i,j}, ... x_{i, k}]^T[2]$ 显然，

k $k$ 表示

xi $x_i$ 的第

k $k$ 维。

实际上 $x_i$ 也可以写成
$x_i = [x_{i, 1},x_{i,2}, ..., x_{i,j}, ... x_{i, k}]$ ，如果这样的话，后面的 $W$ 和公式 $[6]$ 就要做一点改动。如果推导过程很熟悉，可以将 $W$ , $x_i$ , $X$ , $y_i$ ， $Y$ 等根据需求随意改变，不作限定。