逻辑回归LR推导（sigmoid，损失函数，梯度，参数更新公式）

最新推荐文章于 2024-05-28 17:15:54 发布

月zhy

最新推荐文章于 2024-05-28 17:15:54 发布

阅读量1.6w

点赞数 7

分类专栏：数学推导文章标签：逻辑回归

本文链接：https://blog.csdn.net/zhy8623080/article/details/73188671

版权

$x(1),x(2),...,x(m)$ 表示 n 维空间的一个样本， $x(i)$ 表示第i个样本， $x(i)_j$ 表示第i个样本的第j维的数据（因为 $x$ 是一个n维向量）。
$y(1),y(2),...,y(m)$ 表示 k 维空间的一个观测结果，记k从1,2,…,k变化，即分类问题中的k个类别，也可以0为下标开始，不影响推导。
$\pi()$ 是我们学习到的概率函数，实现样本数据到预测结果的映射： $R^n\rightarrow R^k$ ，（其实就是样本经过函数 $\pi()$ 计算后得到各个类别的预测概率，即一个k维向量），
$\pi(x)_u$ 表示数据样本x属于类别u的概率，我们希望 $\pi()$ 具有如下性质：
1. $\pi(x)_v>0$ (样本x属于类别v的概率大于0，显然概率必须大于0)
2. $\sum_{v=1}^k\pi(x)_v = 1$ ,样本x属于各个类别的概率和为1
3. $\pi(x(i))_{y(i)}在所有类别概率中最大$
$A(u,v)$ 是一个指示函数， $当u=v时A(u,v)=1，当u\neq v时A(u,v)=0，如A(u,y(i))$ 表示第i个观测结果是否为u

对于二分类问题有k=2，对线性回归函数 $\lambda x$ 进行非线性映射得到：

π (x) 1 = e λ \cdot x e λ \cdot x + 1 (1)

$\pi(x)_1 = \frac{\rm e^{\lambda \cdot x}}{\rm e^{\lambda \cdot x}+1}\tag{1}$

π (x) 2 = 1 - π (x) 1 = 1 e λ \cdot x + 1 (2)

$\pi(x)_2 = 1-\pi(x)_1= \frac{1}{\rm e^{\lambda \cdot x}+1}\tag{2}$
对于多分类问题有：

π (x) = e λ v \cdot x \sum m u = 1 e λ u \cdot x (3)

$\pi(x) = \frac{\rm e^{\lambda _v\cdot x}}{\sum_{u=1}^m\rm e^{\lambda_u \cdot x}}\tag{3}$
对

λ $\lambda$ 求偏导可得：

u = v 时 ， \partial π ( x ) v λ v , j = x j e λ v , j \cdot x \cdot \sum m u = 1 e λ u , j \cdot x - x j e λ v , j \cdot x e λ v , j \cdot x ( \sum m u = 1 e λ u , j \cdot x ) 2 = x j e

关注