线性回归

最新推荐文章于 2024-10-15 18:34:14 发布

Zoe____

最新推荐文章于 2024-10-15 18:34:14 发布

阅读量516

点赞数

分类专栏：机器学习文章标签：机器学习线性回归

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zoe_su/article/details/52506026

版权

机器学习专栏收录该内容

4 篇文章 0 订阅

订阅专栏

线性模型是最简单的模型，但是往往却也是比较有效的模型。线性模型形式简单，建模容易，常作为机器学习的首选模型，因为其蕴含机器学习的重要基本思想。

建模：

给定数据集为D={(x₁,y₁),(x₂,y₂),…,(x_n,y_n)}，其中x_i={x_i1,x_i2,…,x_im}, y_i∈R，建立模型如下：

y i = h i (θ) = Θ T x i + ϵ i

$y^i=h_i(\theta)=\Theta^T x^i+\epsilon^i$
由 中心极限定理可知：

ϵ i \sim N (0, σ 2)

$\epsilon^i \sim N(0,\sigma^2)$
即：

P (ϵ i) = 1 ( \sqrt 2 π σ ) e x p (- ( ϵ i ) 2 2 σ 2)

$P(\epsilon^i)={1\over\sqrt(2\pi\sigma)}exp(-{(\epsilon^i)^2\over2\sigma^2})$
故：

P (y i | x i, θ) = 1 ( \sqrt 2 π σ ) e x p (- ( y i - Θ T x i ) 2 2 σ 2)

$P(y^i|x^i,\theta)={1\over\sqrt(2\pi\sigma)}exp(-{(y^i-\Theta^T x^i)^2\over2\sigma^2})$
根据 最大似然估计，似然函数为：

L (θ =) = \prod i = 1 m 1 ( \sqrt 2 π σ ) e x p (- ( y i - Θ T x i ) 2 2 σ 2)

$L(\theta=)=\prod_{i=1}^{m}{1\over\sqrt(2\pi\sigma)}exp(-{(y^i-\Theta^T x^i)^2\over2\sigma^2})$
此时，对数似然函数为：

l (θ) = l o g L (θ) = m l o g 1 ( \sqrt 2 π σ ) - 1 σ 2 1 2 Σ m i (y i - Θ T x i) 2

$l(\theta)=logL(\theta)=mlog{1\over\sqrt(2\pi\sigma)}-{1\over\sigma^2}{1\over2}{\Sigma^m_i}(y^i-\Theta^T x^i)^2$
将与θ相关的定义为 目标函数：

J (θ) = 1 2 Σ m i (h i (θ) - y i) 2

$J(\theta)={1\over2}{\Sigma^m_i}(h_i(\theta)-y^i)^2$

注意：上述过程解释了为什么选用RMSE作为线性回归的目标函数。

求解：

根据最大似然估计求解步骤，对目标函数关于θ求偏导得：

Δ θ J (θ) = Δ θ 1 2 Σ m i (h i (θ) - y i) 2 = X T X θ - X T y = 0

$\Delta_θ J(θ)=\Delta_θ{1\over2}{\Sigma^m_i}(h_i(\theta)-y^i)^2=X^TXθ-X^Ty=0$
则线性回归中，最小二乘意义下的参数最优解为：

θ = (X T X) - 1 X T y

$θ=(X^TX)^{-1}X^Ty$
由于上式子不易计算，引入 梯度下降进行求解θ：

J (θ) = 1 2 Σ m i (h i (θ) - y i) 2

$J(\theta)={1\over2}{\Sigma^m_i}(h_i(\theta)-y^i)^2$

θ j = θ j - α \partial J ( θ ) \partial θ

$\theta_j=\theta_j-\alpha{\partial{J(\theta)}\over{\partial\theta}}$

\partial J ( θ ) \partial θ i = (h θ (x) - y) x j

${\partial{J(\theta)}\over{\partial\theta_i}}=(h_\theta(x)-y)x_j$

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Zoe____ CSDN认证博客专家 CSDN认证企业博客

码龄8年

11: 原创

111万+: 周排名

139万+: 总排名

6万+: 访问

: 等级

583: 积分

33: 粉丝

42: 获赞

18: 评论

153: 收藏

私信

关注

热门文章

分类专栏

机器学习 4篇
Tools 3篇
面试
python 1篇
自适应学习 3篇
推荐 1篇
CTR 1篇
应用类 1篇

最新评论

深度知识追踪（Deep Knowledge Tracing）
KT扫地僧: 前辈，进群答案是啥啊，试了好几次都没对，dkt不就是基于循环神经网络的知识追踪模型嚒
混合专家系统（MoE）
zhcdesmond: 请问楼主这篇博客的参考文献是哪些呢？
项目反应理论 EM估计
qss1996: 你好，这个有具体的代码可以参考嘛
深度知识追踪（Deep Knowledge Tracing）
墨骅: 好！很有精神！
深度知识追踪（Deep Knowledge Tracing）
恒星1996: 在PDKT-C中，将两个约束R1和R2合并到一个公式的时候，t1和t2的大小关系有约束吗？R1中t1>=t2, R2中t1<=t2，为什么合在一起就没有大小的关系了呢？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。