逻辑回归及其梯度下降法优化的详细推导过程和实现代码

最新推荐文章于 2022-11-24 17:36:53 发布

坚持不过七天

最新推荐文章于 2022-11-24 17:36:53 发布

阅读量1.5k

点赞数 1

分类专栏：磕盐之鹿 Python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yan_dan/article/details/103335527

版权

Logistic Regression 逻辑回归

参考李航《统计学习方法》第六章

1. Logistic distribution

逻辑斯蒂分布，主要就是逻辑斯蒂分布函数F。因为其函数值在[0, 1]之间，符合概率的分布特点，良好的对称性也是选择它的一个原因。

一般的逻辑斯蒂分布函数如下：

$\frac{1}{1+e^{-(x-\mu)/\gamma }} \tag{1.1}$
其实 $\mu$ 为位置参数， F(x) 关于点 $(\mu, \frac{1}{2})$ 中心对称。 $\gamma >0$ 为形状参数，值越小，曲线在中心附近增长越快。

当 $\mu=0 \ \gamma=1$ 时，分布函数F为

$\frac{1}{1+e^{-x}} \tag{1.2}$
这个就是我们常用的sigmoid函数（S形曲线）。

2. 二项Logistic 回归模型

对于二分类的模型，有如下的条件概率分布：

$\frac{1}{1+e^{-wx}} \tag{2.1}$

$=\frac{1}{1+e^{wx}} \tag{2.2}$
其实 $w\ x$ 都是拓展后的向量。 $w=(w^{(1)},w^{(2)},w^{(3)},...,w^{(n)},b)\ x=(x^{(1)},x^{(2)},x^{(3)},...,x^{(n)},1)$

在这个模型中，它只是做了两件事儿：

线性变换： $w x + b$
将线性变换的值代入sigmoid函数中

3. 二项模型参数估计

3.1 参数估计的过程就是最大似然估计+最优化问题

训练数据 $T=\{(x_1, y_1),\ (x_2, y_2),\ (x_3, y_3),\ ...,\ (x_n, y_n)\ \}$

似然函数为

$\prod_{i=1}^{n}P(y=1|x_i)^{y_i}\ {(\ 1-P(y=1|x_i)\ )}^{1-y_i} \tag{2.3}$
对数似然函数为

$\begin{aligned}L(w) =& \sum_{i=1}^{n}[y_i\ logP(y=1|x_i)+(1-y_i)\ log(1-log\ P(y=1|x_i)))] \\ =& \sum_{i=1}^{n}[y_i\ (w*x_i)- log(1+e^{w*x_i})] \tag{2.4} \end{aligned}$

最低0.47元/天解锁文章

坚持不过七天

关注

1
点赞
踩
8

收藏

觉得还不错? 一键收藏
1
评论
逻辑回归及其梯度下降法优化的详细推导过程和实现代码

Logistic Regression 逻辑回归参考李航《统计学习方法》第六章1. Logistic distribution逻辑斯蒂分布，主要就是逻辑斯蒂分布函数F。因为其函数值在[0, 1]之间，符合概率的分布特点，良好的对称性也是选择它的一个原因。一般的逻辑斯蒂分布函数如下：F(x)=11+e−(x−μ)/γ(1.1) F(x)= \frac{1}{1+e^{-(x-\mu)/...
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。