线性回归

最新推荐文章于 2024-05-10 17:01:28 发布

智元说车

最新推荐文章于 2024-05-10 17:01:28 发布

阅读量1.1k

点赞数 1

分类专栏：机器学习文章标签：机器学习算法回归

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u012771351/article/details/53163495

版权

机器学习专栏收录该内容

35 篇文章 4 订阅

订阅专栏

注：本文中所有公式和思路来自于邹博先生的《机器学习升级版》，我只是为了加深记忆和理解写的本文。

本文将跟大家介绍一下线性回归，直接步入主题。

现在我们有一些关于房价的数据，根据房屋得大小居室来预测价钱：

那么我们可以将第一个特征Living area看作x1，可以讲第二个特征bedrooms看作x2，Price为h(x)，我们可以公式化得写成：

其中讲x0设为0，则可以写成统一的式子：

我们先直观的看一看模型得图：

看的出来大多数得预测值与实际值还是有一定得差距，我们用ε表示，那么可以有以下等式：

这个ε我们可以这么来解释，认为它是独立分布的，服从均值为0，方差为某个定值得高斯分布，之所以这么说是因为ε是有众多得原因导致得，比方说学区、朝向、交通、格局等等众多原因相互作用的一个残差，因此根据中心极限定理，认为是服从高斯分布的，既然是服从高斯分布，可以如下表示：

我们将ε代入：

我们可以将这个式子作为似然函数：

接着我们对似然函数取对数，得到对数似然：

变换过程很简单我就不说了，其中m是样本数量，π、σ也是定值，所以我们直接化简为：

我们的目标就是求J(θ)最小，这个也是著名的最小二乘的目标函数，我们可以变换一下：

对θ求偏导得到梯度：

可以得到参数的解析式：

当然了，如果XTX不可逆或者防止过拟合，可以加入λ扰动：

其实加入λ并不是不可解释的，其实是计算得来的，首先说如果XTX不可逆，加入λ即为正定矩阵：

那么对于任意的λ>0，XTX加上λ就一定为正定，从而可逆，这样公式就是有意义的，那么对于第二个作用：加入λ可以防止过拟合我们可以这么解释，在目标函数后边加个惩罚项：

然后将这个目标函数重新按照之前的办法求导，即可得到前边我们得到的目标函数。

其中的这个λ是个超参数，我们如果偷懒的话可以设置一个小的值，比如0.1、0.01，其实正统的办法我们应该使用交叉验证来做。交叉验证的具体步骤就不介绍了，比较简单。

当然了，如果特征规模很大，超过了1000维，那么矩阵的逆是不方便求的，因此我们可以使用梯度下降算法来做。

梯度下降算法

(1): 初始化θ(随机初始化)

(2): 沿着负梯度方向迭代，更新后的θ使得J(θ)更小：

其中α是步长、学习率，超参数，可以指定一个较小的步长，也可以使用折半查找、回溯、拟牛顿来求一个动态的α(后续会介绍)。

Andrew NG的machine learning的课件中这么描述更新步骤：

其中有个∑从i到m加和，也就是说每更新一次，都是拿全部的训练样本来做一次梯度下降，叫做批量梯度下降，这样的话其实效率比较低，我们可以使用下边的方法做：

这种方法每次是拿一个样本来迭代一次梯度，效率会比较高，这种方式叫做随机梯度下降。

当然了，还可以采用一种折中的办法：每次拿到若干个样本的平均梯度作为更新方向，这就是mini-batch梯度下降算法，CNN中就是采用这种方式来做的。

其他的线性回归

局部加权线性回归：

其中w一种可能的选择方式(高斯核函数)：

其中τ为带宽，他是控制着训练样本随着xi距离的衰减速率

到此线性回归暂时介绍到这里，在下文终将会介绍另一种线性回归：Logistic回归，欢迎批评指正！

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
线性回归

注：本文中所有公式和思路来自于邹博先生的《机器学习升级版》，我只是为了加深记忆和理解写的本文。本文将跟大家介绍一下线性回归，直接步入主题。现在我们有一些关于房价的数据，根据房屋得大小居室来预测价钱：那么我们可以将第一个特征Living area看作x1，可以讲第二个特征bedrooms看作x2，Price为h(x)，我们可以公式化得写成：其中讲x0设
复制链接

扫一扫

专栏目录

智元说车 CSDN认证博客专家 CSDN认证企业博客

码龄11年

34: 原创

24万+: 周排名

156万+: 总排名

12万+: 访问

: 等级

1647: 积分

64: 粉丝

67: 获赞

7: 评论

118: 收藏

私信

关注

热门文章

分类专栏

机器学习 35篇
linux 2篇
deep learning 1篇

最新评论

HMM之前向后向算法
weixin_46083434: 你好，非常感谢你的讲解让我可以把前向算法和后向算法结合起来理解，不过还有两个问题不是很明白，1. 单个状态的概率那个公式，分母P(o|lamda) 换成alphat(i)*betat(i)再对所有i（状态）求和，是因为生成观测序列o的总概率是t时刻下每个i（状态）可能的概率之和吗？ 2. 最后那个联合概率转换到最终结果不太明白，请问可以请教一下再具体一点的步骤吗？谢谢
LDA-隐狄利克雷分布-主题模型
leilei9406: 想请问下如果做短文拼接可以有哪些方法，我正在做一个短文本的LDA结果不是很好，可以请教下您吗？
变分算法
qq_36711371: 请问一下，P（x）和q（x）的距离公式中，α=1的时候，公式为什么会退化为KL(p||q)，α=1时，分母为0.
HMM之前向后向算法
Chester_ieee: 前后向概率的公式，i和t好像是写反了。
聚类之层次聚类与密度聚类
落入凡间的奥特曼: 你好，请问这个机器学习升级版是课程吗?

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。