手推逻辑回归（logistic regression）

最新推荐文章于 2024-07-27 10:38:25 发布

Fly_TheWind

最新推荐文章于 2024-07-27 10:38:25 发布

阅读量792

点赞数

分类专栏：机器学习文章标签：手推LR LR为什么要用sigmod 为什么不用均方差作为代价函数

本文链接：https://blog.csdn.net/Fly_TheWind/article/details/99631087

版权

本文详细介绍了逻辑回归的原理，包括构造hypothesis假设函数、损失函数（直接构造与极大似然构造）、梯度下降优化过程以及正则化。重点探讨了为何选择sigmoid函数，并解释了为何不使用均方差作为损失函数的原因。

摘要由CSDN通过智能技术生成

logistic 回归

#TOC

一、构造hypothesis假设函数

Logistic Regression 可以看做是一个 线性回归（Linear Regression） 经过一个sigmod激活函数的结果。
线性回归方程：$ \theta_0 + \theta_1x_1+ \theta_2x_2+…+ \theta_n*n_n = \theta^T * x$
sigmoid函数： $\frac{1}{1+e^{-z}}$
所以hypothesis 函数 $h_\theta (x) = \frac {1}{1+e^{-\theta^Tx}}$
$h_\theta (x)$ 表示为样本预测正例的概率
即：
$KaTeX parse error: No such environment: equation at position 9: \begin{̲e̲q̲u̲a̲t̲i̲o̲n̲}̲ \left\{ \begin…$

可以将公式（1）合并成：
$P(y|x;\theta) = h_\theta(x^{(i)})^{y^{(i)}} (1-h_\theta(x^{(i)}))^{1- y^{(i)}} \tag{2}$

二、构造损失函数

下面介绍两种不同的构造假设函数的方法：
第一种是来源于NG的机器学习课程；
第二种是以概率的方式通过极大似然来构造代价函数

直接构造损失函数

构造代价函数：
$KaTeX parse error: No such environment: equation at position 23: …heta) = \begin{̲e̲q̲u̲a̲t̲i̲o̲n̲}̲ \left\{ \begin…$
[外链图片转存失败(img-NybE3yxJ-1565846168527)(media/15655785068654/15657637829206.jpg)]
如图一：
当y = 1，
若假设函数预测结果为1。则代价函数为0；
当假设函数预测结果越接近0时，其代价就越大。
当 y = 0时同理
将两式化归一起：
$Cost(\theta) = -\frac1m\sum_{i=1}^m y^{(i)}log^{h_\theta(x)} + (1-y^{(i)})log^{1 - h_\theta(x)}$