算法一、回归

最新推荐文章于 2024-09-13 21:50:07 发布

赛大爷

最新推荐文章于 2024-09-13 21:50:07 发布

阅读量448

点赞数 1

分类专栏：机器学习文章标签：回归梯度下降最大似然估计机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39818658/article/details/79440209

版权

机器学习专栏收录该内容

1 篇文章 0 订阅

订阅专栏

一、主要内容

1、线性回归

高斯分布

极大似然

最小二乘

梯度下降

2、logistic回归

分类问题的首选算法

二、线性回归

1、线性回归定义

回归模型描述的是一个因变量(Y)和一个或多个自变量之间(X)的关系，而线性回归描述的是不同的自变量对因变量都有不同的作用效果我们称作权重（θ）,并且他们对因变量产生的影响都是线性可加的，可以描述为：

直白说就是通过拟合自变量与因变量之前的线性关系，将自变量的值传入模型中得到因变量的预测值，并尽量使得预测值接近实际值的过程。（说法不严谨，此做法容易造成过拟合）

图像解释如下：

2、线性回归推导

使用极大似然估计解释最小二乘

中心极限定理：实际问题中，很多随机现象可以看做众多因素的独立影响的综合反应，往往近似服从正态分布。城市耗电量：大量用户的耗电量总和测量误差：许多观察不到的、微小误差的总和，注：应用前提是多个随机变量的和，有些问题是乘性误差，则需要鉴别或者取对数后再使用。

最大似然估计：我们手中已经存在获得样本，并且这些样本值已经实现并且可以看作是发生的事件，那么最大似然估计就是找到是时间发生的概率的大的参数θ（因为手中的样本已经实现亦可以说成是时间发生，所以是事件发生的概率最大才符合逻辑）。

我们所拟合的模型的目的是预测实际值，那预测值与实际值之间必定是存在一定的误差的即：，为预测值和实际值之间的误差，我们假设样本点都是独立同分布的，那么根据中心极限定理可知，误差是独立同分布的，服从均值为0，方差为某定值的高斯分布。

那么我们可以写出关于误差的似然概率，因为是独立同分布的则，似然概率为误差的连乘：

若要求其最大值，正常的逻辑就是对其求导得0并且计算出参数θ，因为似然函数为连乘的形式，需要对其取对数变为相加的形式。

根据上面的推导，因为为定值，那么最后的结果就变成了求：

最小值。

则目标函数为：

（求该目标函数最小就是最小二乘法）

求解：

可得：

简便”方法记忆结论：

而在我们实践中我们往往不会对目标函数进行求导求其解析解，并且并不是所有模型的目标函数都存在解析解，那么会采用梯度下降的方式来不断的接近最有参数θ。

梯度下降算法

过程如下：

1、初始化θ(随机初始化)

2、求解梯度：

3、沿着负梯度方向迭代，更新后的θ使J(θ)更小:

（α：学习率、步长）

4、将求得的参数带回模型建立结束。

三、Logistic回归

1、Logistic回归定义

Logistic回归是针对线性可分问题的一种简单而且优异的分类模型。

对于线性回归公式如下即：

而logistic回归也是基于现行回归的（Logistic回归可以认为是广义的线性回归，后面会解释），

公式如下：

其中被称作sigmoid函数图像如下，logistic回归是将现行的结果映射到了sigmoid函数上，由图像可知是介于（0,1）之间的，也就说明logistic函数的输出值是样本属于某一类别的概率：

例：

属于A类；

属于B类。

那么接下来的任务就是求解参数：

假定：

同样采用极大似然估计方法写出似然概率：

取对数得到对数似然概率并求导：

最后同样采用梯度下降算法求解参数θ：

对数线性模型

即假设某时间发生的概率为P，那么时间不发生的概率为（1-P）乘P/（1-P）为时间发生的几率（odd）我们对几率取对数定义为。

所以说logistic回归是广义上的线性模型。

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

赛大爷 CSDN认证博客专家 CSDN认证企业博客

码龄7年

2: 原创

171万+: 周排名

86万+: 总排名

4430: 访问

: 等级

73: 积分

1: 粉丝

5: 获赞

1: 评论

10: 收藏

私信

关注

热门文章

分类专栏

机器学习 1篇
python 数据处理 1篇

最新评论

像写SQL一样学习pandas 中 DataFrame
taozhi11up: 你好，请问你试过sqldf语法更接近sql哪类语法吗，是Mysql还是postgresql还是sql server呢？

最新文章

像写SQL一样学习pandas 中 DataFrame

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。