机器学习：逻辑回归（Logistic Regression）

最新推荐文章于 2020-11-10 20:41:30 发布

诚朴求食

最新推荐文章于 2020-11-10 20:41:30 发布

阅读量938

点赞数

分类专栏：机器学习文章标签： LR 逻辑回归机器学习分类

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/fengchi863/article/details/80173338

版权

机器学习专栏收录该内容

23 篇文章 0 订阅

订阅专栏

定义：逻辑回归假设数据服从伯努利分布，通过极大化似然函数的方法，运用梯度下降来求解参数，来达到将数据二分类的目的。

输入：逻辑回归的输入是一个线性组合，与线性回归一样，但是输出变成了概率。通过伯努利（类似抛硬币的概率分布）的概率公式我们可以得到sigmoid函数。

逻辑回归的最终形式：

$h_{\theta }(x;\theta)=\frac{1}{1+e^{-\theta^{T}x}}$

函数图像如下图，一般按0.5分类。

逻辑回归的损失函数是它的极大似然函数：

$L_{\theta }(x)=\prod_{i=1}^{m}h_{\theta }(x^{i};\theta )^{y^{i}}*(1-h_{\theta }(x^{i};\theta ))^{1-y^{i}}$

这个极大似然函数无法直接求解，所以通过对它梯度下降来不断逼近最优解。

处理过拟合：取L1或L2正则化，通过对权重增加惩罚来防止过拟合。一般使用L2正则化，L1正则化是截断效应，L2正则化是缩放效应。

优点：
1）形式简单，可解释性好，可以从权重的大小看到不同的特征对最后结果的影响，从而可以筛选出前k个影响最大的特征；
2）模型效果不错，可以作为baseline，如果特征工程做得好，效果就不会太差；
3）训练速度快，计算量只和特征的数据相关，资源占用小，尤其是内存，因为只需要存储各个维度的特征值；
4）方便输出结果调整，对最后输出的概率分数进行阈值划分，样本结果大于某个阈值的是一类，小于某个阈值的是一类；

缺点：
1）准确率不是很高，因为形式非常的简单；
2）很难处理数据不平衡的情况（此处可以说一下有哪些方法处理不平衡）；
3）处理非线性数据比较麻烦；

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习：逻辑回归（Logistic Regression）

定义：逻辑回归假设数据服从伯努利分布，通过极大化似然函数的方法，运用梯度下降来求解参数，来达到将数据二分类的目的。输入：逻辑回归的输入是一个线性组合，与线性回归一样，但是输出变成了概率。通过伯努利（类似抛硬币的概率分布）的概率公式我们可以得到sigmoid函数。逻辑回归的最终形式：hθ(x;θ)=11+e−θTxhθ(x;θ)=11+e−θTxh_{\theta }(x;\theta)...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。