白话机器学习-逻辑斯蒂回归-理论篇

最新推荐文章于 2024-07-09 10:12:06 发布

秃顶的码农

最新推荐文章于 2024-07-09 10:12:06 发布

阅读量505

点赞数

分类专栏：机器学习算法文章标签：数据挖掘机器学习逻辑回归

本文为博主原创文章，未经博主允许不得转载。

本文链接：https://blog.csdn.net/qq_22054285/article/details/79101276

版权

机器学习算法专栏收录该内容

28 篇文章 23 订阅

订阅专栏

白话机器学习-逻辑斯蒂回归-理论篇

@(2018年例会)

白话机器学习-逻辑斯蒂回归-理论篇

概述

前面讲述了线性回归，线性回归的模型 $y = w^T + b$ 。模型的预测值逼近真实标记y。那么可否令模型的预测值逼近真实标记y的衍生物呢。比如说模型的预测值逼近真实标记的对数函数。下面引入逻辑回归的知识。

转换函数

我们需要一个单调可微函数将分类任务的真实标记y与线性回归模型的预测值联系起来，所以需要一个转换函数将线性模型的值与实际的预测值关联起来。
考虑二分类问题，其输出标记是y属于{0，1}，而线性模型产生的预测值是 $z = w^T + b$ 是实值，那么我们需要将这个实值转化成0/1值，最理想的函数是单位阶跃函数。

单位阶跃函数

单位阶跃函数（unit-step function），如下图，如果预测值大于零则判断为正例；如果预测值小于零则判断为反例；为零的则任意判断。如下图所示。

y = ⎧ ⎩ ⎨ 0 0.5 1 if z < 0 if z = 0 if z > 0

$\begin{equation} y = \begin{cases} 0 & \mbox{if z < 0}\\ 0.5 & \mbox{if z = 0} \\ 1 & \mbox{if z > 0} \end{cases} \end{equation}$

sigmoid function

从图中可以看出，单位阶跃函数不连续因此不适合用来计算。这里我们引入sigmoid函数，进行计算。

$y = 1 1 + e - z$ $y = \dfrac{1}{1 + e^{-z}}$

将z值转化为一个接近0或1的y值，并且其输出值在z=0的附近变化很陡。那么我们现在的模型变化成

y = 1 1 + e - ( w T + b )

$y = \dfrac{1}{1 + e^{-(w^T + b)}}$

enter image description here

几率与对数几率

几率：如果将y作为正例的可能性，1-y作为负例的可能性，那么两者的比值 $\dfrac{y}{1 - y}$ 称为几率，反应了x作为正例的相对可能性。则根据sigmoid函数可得。

l n y 1 - y = w T + b

$ln\dfrac{y}{1 - y} = w^T + b$

$ln\dfrac{y}{1 - y}$ 称为对数几率；

由此可以看出， $y = \dfrac{1}{1 + e^{-(w^T + b)}}$ 实际上是用线性模型的预测结果去逼近真实标记的对数几率，因此，其对应的模型称为“对数几率回归”

下面介绍损失函数以及计算方法。

损失函数

因为： $ln\dfrac{y}{1 - y} = w^T + b$ 。所以

p (y = 1 | x) = e ( w T + b ) 1 + e ( w T + b )

$p(y=1|x) = \dfrac{e^{(w^T + b)}}{1 + e^{(w^T + b)}}$

p (y = 0 | x) = 1 1 + e ( w T + b )

$p(y=0|x) = \dfrac{1}{1 + e^{(w^T + b)}}$

我们采用极大似然估计法进行求解，由于是二分类问题，所以符合概率里面的0-1分布，所以似然函数为
令 $p(y=1|x) = \dfrac{e^{(w^T + b)}}{1 + e^{(w^T + b)}} = f(x)$ ， $p(y=0|x) = \dfrac{1}{1 + e^{(w^T + b)}}=1-f(x)$