一元线性回归

最新推荐文章于 2024-08-13 22:25:51 发布

nibaer

最新推荐文章于 2024-08-13 22:25:51 发布

阅读量274

点赞数 1

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/nibaer/article/details/52528235

版权

假设 $(x_{1},y_{1}), （x_{2},y_{2}), ..., （x_{n},y_{n})$ 是总体的n个观测值，一元线性回归的hypothesis函数:
$h_{\theta }(x)=\theta_{0}+\theta_{1}x$
观测值标示为估计值加误差的形式：
$y_{i}=\theta_{0}+\theta_{1}x_{i}+e_{i}$
误差的平方和：

Q = \sum i = 1 n (y i - θ 0 - θ 1 x i) 2

$Q=\sum_{i=1}^{n}(y_{i}-\theta_{0}-\theta_{1}x_{i})^{2}$

最小二乘法是通过最小化Q来求 $\theta_{0},\theta_{1}$

求解方法1 偏导为0，Q取最小值：
求Q对于 $\theta_{0},\theta_{1}$ 的偏导：

\partial Q \partial θ 1 = - 2 \sum i = 1 n (y i - θ 0 - θ 1 x i) x i

$\frac{\partial Q}{\partial \theta_{1}}=-2\sum_{i=1}^{n}(y_{i}-\theta_{0}-\theta_{1}x_{i})x_{i}$

\partial Q \partial θ 0 = - 2 \sum i = 1 n (y i - θ 0 - θ 1 x i)

$\frac{\partial Q}{\partial \theta_{0}}=-2\sum_{i=1}^{n}(y_{i}-\theta_{0}-\theta_{1}x_{i})$
偏导为0，Q取最小值得到：

θ 1 = n \sum x i y i - \sum x i \sum y i n \sum x 2 i - ( \sum x i ) 2

$\theta_{1}=\frac{n \sum x_{i}y_{i}- \sum x_{i} \sum y_{i}}{n \sum x_{i}^2- (\sum x_{i})^2}$

θ 0 = \sum x 2 i \sum y i - \sum x i \sum x i y i n \sum x 2 i - ( \sum x i ) 2

$\theta_{0}=\frac{\sum x_{i}^2 \sum y_{i}- \sum x_{i} \sum x_{i}y_{i}}{n \sum x_{i}^2- (\sum x_{i})^2}$

求解方法2 直观图形：
首先把所以的点都标准化

x i' = x i - μ x σ x

${x_{i}}^{'}=\frac{x_{i}-\mu _{x}}{\sigma _{x}}$

y i' = y i - μ y σ y

${y_{i}}^{'}=\frac{y_{i}-\mu _{y}}{\sigma _{y}}$
最佳直线为

y' = r x'

${y}^{'}=r{x}^{'}$

r=∑(xi−x¯)(yi−y¯)nσxσy $r=\frac{\sum(x_{i}-\bar{x})(y_{i}-\bar{y})}{n\sigma _{x}\sigma _{y}}$ 为

xi $x_{i}$ 与

yi $y_{i}$ 的相关系数，即

y - μ y σ y ＝ r x - μ x σ x

$\frac{y-\mu _{y}}{\sigma _{y}}＝r\frac{x-\mu _{x}}{\sigma _{x}}$

θ 1 = r σ y σ x

$\theta_{1}=r\frac{\sigma _{y}}{\sigma _{x}}$

θ 0 = μ y - r μ x σ y σ x

$\theta_{0}=\mu _{y}-r\mu _{x}\frac{\sigma _{y}}{\sigma _{x}}$
把r代入得到

θ 1 = n \sum x i y i - \sum x i \sum y i n \sum x 2 i - ( \sum x i ) 2

$\theta_{1}=\frac{n \sum x_{i}y_{i}- \sum x_{i} \sum y_{i}}{n \sum x_{i}^2- (\sum x_{i})^2}$

θ 0 = \sum x 2 i \sum y i - \sum x i \sum x i y i n \sum x 2 i - ( \sum x i ) 2

$\theta_{0}=\frac{\sum x_{i}^2 \sum y_{i}- \sum x_{i} \sum x_{i}y_{i}}{n \sum x_{i}^2- (\sum x_{i})^2}$
求解方法3 梯度下降：
start with some

θ0 $\theta_{0}$ ,

θ1 $\theta_{1}$
repeat until convergence{

θ 0 = θ 0 - a \partial Q \partial θ 0

$\theta_{0}=\theta_{0}-a\frac{\partial Q}{\partial \theta_{0}}$

θ 1 = θ 1 - a \partial Q \partial θ 1

$\theta_{1}=\theta_{1}-a\frac{\partial Q}{\partial \theta_{1}}$
}
a是步长，learning rate
hopefully we have the minimum of Q

第一种偏导为零是直接法，第三种梯度下降是迭代法，都是求误差平方和的方法。 $\theta_{0}$ , $\theta_{1}$ 的初始值，步长都影响梯度下降的结果。

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。