机器学习（二）：逻辑回归

最新推荐文章于 2022-10-06 22:31:47 发布

芙兰泣露

最新推荐文章于 2022-10-06 22:31:47 发布

阅读量459

点赞数

分类专栏：机器学习与算法文章标签：机器学习

本文链接：https://blog.csdn.net/u012882134/article/details/78148496

版权

本文详细介绍了逻辑回归模型，包括数据描述、模型参数形式、跃阶与sigmoid函数、似然函数作为评判指标，以及梯度上升法。讨论了0-1损失和log损失在模型训练中的作用，并指出sigmoid函数在逻辑回归中的重要性。

摘要由CSDN通过智能技术生成

逻辑回归（Logistic Regression），是机器学习中的一个分类模型。
按理说逻辑回归并不是分类模型中最简单的一个（最简单的应该是KNN），但为什么要从该模型开始呢？
原因有二：1.逻辑回归涉及到的一些知识点是后面机器学习的基础，2.笔者两次面试都被问道了逻辑回归。。。
本节将顺着如下逻辑进行讲解：
1.样本描述
2.处理结果的函数（跃阶函数还是sigmoid函数）
3.使用似然函数来确定求 $\theta$ 的方法
4.使用梯度上升求梯度以求得 $\theta$
5.补充：如何使用损失函数

数据描述

这里什么是分类聚类就不介绍了，直接引入数据如下：
$(x^i, y^i)$ 是一条记录。其中 $y^i\in\{0,1\},x^i=(x_1^i,...,x_n^i),x_j^i\in R$ ，即该问题是二分类问题。数据维度为n。

模型参数形式

类似于线性规划，模型表达式为：

f (x i) = x i θ, 其 中 θ = (θ 1, . . ., θ n)

$f(x^i)=x^i\theta,其中\theta=(\theta_1,...,\theta_n)$
到这里，给出了如何获得模型的值

f(xi) $f(x^i)$ ，但却没有说明拿到这个值后如何处理。

跃阶函数

即使用如下函数来判断模型对于输出参数的取值

g 1 (x) = {10 0 \leq x 0 > x

$g_1(x)=\left\{ \begin{aligned} 1 && {0 \le x}\\ 0 && {0 > x}\\ \end{aligned} \right.$
上式是逻辑回归的基本假设，即使用属性的一阶函数（自变量的线性组合）来预测。
当

x $x$ 大于等于0时，模型给出的标签值为1，否则为0.

sigmoid 函数

先介绍其形式：

g 2 (x) = 1 1 + e - x

$g_2(x)=\frac{1}{1+e^{-x}}$

sigmoid 函数可以作为跃阶函数的替代。如果看过讲解逻辑回归的资料就会发现，大部分相关资料讲到逻辑回归都会提到sigmoid 函数，并将其作为得到最后结果的最后一步。
但其实，sigmoid 函数完全不是逻辑回归的重点，而只是一种处理模型结果的手段。
我们既可以使用 $\hat {y^i}=g_1(f(x^i))$ （即跃阶函数）来给出最后的标签，也可以使用 $\hat {y^i}=g_2(f(x^i))$ （sigmoid 函数）来给出最后的标签。
不论是使用哪一种， $\hat {y^i}=g(f(x^i))$ 都可以理解为表示给定样本点x,模型判断为属于“1”的概率，但同时有能根据 $\hat {y^i}$ 本身的大小来判断是取“0”还是“1”。
例如，当 $g(x)$ 为sigmoid函数时 $\hat {y^i}=g(f(x^i))=\frac{1}{1+e^{-f(x^i)}}=\frac{1}{1+e^{-x^i\theta}}$ 表示当 $x^i\theta$ 越大， $\hat {y^i}$ 越靠近1。
此时求得的 $\hat {y^i}$ 是 ${x^i}$ 样本点属于类“1”的概率。
即