逻辑回归及其数学推导

最新推荐文章于 2024-07-17 00:46:41 发布

cvrszeng

最新推荐文章于 2024-07-17 00:46:41 发布

阅读量1.9k

点赞数

分类专栏：机器学习文章标签：逻辑回归-机器学习数学推导

本文链接：https://blog.csdn.net/cvrszeng/article/details/52335043

版权

机器学习专栏收录该内容

4 篇文章 0 订阅

订阅专栏

本文只讨论二分类的情况

一、逻辑回归

$\begin{aligned} & P(Y=1|X=x) = { {e^{w^Tx} } \over {1+e^{w^Tx} } } =h(x) \\ &P(Y=0|X=x) = { {1} \over {1+e^{w^T{x}} } } =1-h(x) \\ & log { {P(Y=1|X=x)} \over {P(Y=0|X=x)} } = w^Tx \end{aligned}$

二、参数估计（极大似然估计）

似然函数：
$\prod_ {i=1}^{n} h(x_i)^{y_i} (1-h(x_i))^{1-y_i}$
对数似然函数：
$\begin{aligned} L(w) & = \sum_ {i=1}^{n} ({y_i}log{h(x_i)} + {(1-y_i)}log{(1-h(x_i))} ) \\ & =\sum_{i=1}^{n} (y_iw^Tx_i-y_ilog(1+e^{w^Tx_i})+(y_i-1)log(1+e^{w^Tx_i})) \\ & =\sum_{i=1}^{n} (y_iw^Tx_i - log(1+e^{w^Tx_i})) \end{aligned}$
可以证明 $L (w)$ 是关于 $w$ 的凸函数，有最大值，证明如下：
令 $f(w)=yw^Tx-log(1+e^{w^Tx})$
${{\partial f(w)} \over {\partial w}} =yx-{ {e^{w^Tx}} \over {1+e^{w^Tx}} }$

$\begin{aligned} { { \partial^2f(w) } \over {\partial w \partial w^T} } &=-{ { xe^{ w^Tx }x^T } \over { (1+e^{ w^Tx } )^2 } } \\ &=- { e^{w^Tx} \over { ( 1+e^{ w^Tx } )^2 } } {xx^T} \end{aligned}$

$\forall$ 非零向量 $z$ ， $z^T(xx^T)z=z^Tx(z^Tx)^T \ge0$ ,又因为 $e^{w^Tx} \over { ( 1+e^{ w^Tx } )^2 } } \gt0$ ，所以 $\partial^2f(w) } \over {\partial w \partial w^T} }$ 是半负定矩阵，即 $f (w)$ 是关于 $w$ 的凸函数，有最大值。
对数似然函数对向量 $w$ 求导，可得：

$\begin{aligned} {\partial L(w) \over \partial w} &=\sum_ {i=1}^{n} (y_ix_i-{ {e^{w^Tx_i} } \over {1+{e^{w^Tx_i} } } }x_i) \\ &=\sum_ {i=1}^{n} (y_i-{ {e^{w^Tx_i} } \over {1+{e^{w^Tx_i} } } })x_i \\ &=\sum_ {i=1}^{n}(y_i-h(x_i))x_i \end{aligned}$