Classification : Logistic Regression (SGD)

最新推荐文章于 2022-11-21 15:17:58 发布

昨日西风紧

最新推荐文章于 2022-11-21 15:17:58 发布

阅读量185

点赞数

分类专栏： Mahout 文章标签：逻辑回归 Logistic Regression sgd

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zhou85xin/article/details/88336031

版权

Mahout 专栏收录该内容

41 篇文章 0 订阅

订阅专栏

Logistic Regression (SGD)

Mahout中涉及到的算法

1 线性回归

了解逻辑回归之前先了解下线性回归：因变量和自变量之前存在线性关系。一般模型如下：

从一般模型可以看出Y和X(X1,X2,X3...)之间存在线性关系。线性回归的目的就是为了确定因变量和自变量的关系程度，换言之，就是求回归模型的参数。

2 逻辑回归

(1) why need it?

要说逻辑回归的优点，自然要先说下线性回归的缺点，主要有难以处理以下两个问题

a. 因变量Y如果不是数值型

b. 因变量与自变量不存在线性关系

(2) 逻辑回归的一般形式

P是概率，是某个事件发生的概率，处理类别属性，例如是否是男性，是否是色狼？

而且进行了logit变换。也就是说logit(P)与自变量之间存在线性关系，而p显然和X不存在线性关系。

那为什么是logit变换，不是XXX其他的变换，这里有一个前提假设：概率与自变量的关系往往是 S 型的曲线

(3)参数估计

模型有了，需要利用已知的样本来进行参数估计，最大似然估计用的比较多。mahout中用的是随机梯度下降法(SVD)。此处介绍下随机梯度下降法。

a. 梯度下降法

搜索寻优的一个过程，假定一个初始状态，然后不断更新，知道达到目标函数的极小值。其中称为学习率，他决定梯度下降搜索的步长。算法流程如下：

b. 随机梯度下降

sgd解决了梯度下降的两个问题：收敛速度慢和陷入局部最优。修正部分是权值更新的方法有些许不同。不做详细介绍。

昨日西风紧

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。