机器学习基础（一）——LinearRegression

最新推荐文章于 2022-04-01 17:30:57 发布

alnlll

最新推荐文章于 2022-04-01 17:30:57 发布

阅读量217

点赞数

分类专栏：机器学习基础文章标签：机器学习 Python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/alnlll/article/details/79856594

版权

机器学习基础专栏收录该内容

7 篇文章 1 订阅

订阅专栏

假设输入输出间为线性关系，其中 $\mathit{x} \in \mathbb{R}^n$ , $\mathit{w} \in \mathbb{R}^n$ ,预测输出为 $\widehat{\mathit{y}}$ 。定义输出为：

y ˆ = w T X

$\widehat{\mathit{y}} = w^TX$

使用均方误差作为P来衡量模型的性能，则损失函数为（其中 $\frac{1}{2m}$ 的2加在常数项不影响结果）：

l o s s = 1 2 m \sum i = 1 m (y ˆ (i) - y (i)) 2

$loss = \frac{1}{2m} \sum_{i=1}^{m} (\widehat{\mathit{y}}^{(i)} - y^{(i)})^2$

则目标任务则为：

a r g m i n l o s s : a r g m i n 1 2 m \sum i = 1 m (y ˆ (i) - y (i)) 2

$argmin loss: argmin \frac{1}{2m} \sum_{i=1}^{m} (\widehat{\mathit{y}}^{(i)} - y^{(i)})^2$

可以直观的得出当 $\widehat{\mathit{y}} - y$ 时loss最小，则问题可转化为

a r g m i n 1 2 m | | y ˆ - y | | 22

$argmin \frac{1}{2m} ||\widehat{\mathit{y}} - y||_2^2$

设 $Cost = \frac{1}{2m} ||\widehat{\mathit{y}} - y||_2^2$ ，对 $\mathit{w}$ 求导如下：

d d w C o s t = 1 m d ( X w - y ) T ( X w - y ) d w

$\mathit{ \frac{d}{dw}Cost = \frac{1}{m} \frac{d(Xw - y)^T(Xw - y)}{dw} }$

= 1 2 m d ( X w - y ) T ( X w - y ) d w

$\mathit{ = \frac{1}{2m} \frac{d(Xw - y)^T(Xw - y)}{dw} }$

= 1 2 m d ( w T X T X w - w T X T y - y T X w + y T y ) d w

$\mathit{ = \frac{1}{2m} \frac{d(w^TX^TXw - w^TX^Ty - y^TXw + y^Ty)}{dw} }$

标量转置为其本身：

= 1 2 m d ( w T X T X w - 2 y T X w + y T y ) d w

$\mathit{ = \frac{1}{2m} \frac{d(w^TX^TXw - 2y^TXw + y^Ty)}{dw} }$

d d w C o s t = 1 m X T (X w - y)

$\mathit{ \frac{d}{dw}Cost = \frac{1}{m} X^T(Xw - y) }$

使用梯度下降法同步更新 $\mathit{w}$ ：

w = w - α d d w C o s t

$\mathit{ w = w - \alpha \frac{d}{dw}Cost }$

其中“偏置”通过训练时在样本中增加全1个体获取。

Note1：矩阵求导只是将单个数据的求导矩阵化，根据矩阵的组成方式即可得出结果，如果个别求导过程存在疑问，可以参考：https://en.wikipedia.org/wiki/Matrix_calculus#Scalar-by-vector_identities

以上为线性回归的基本思想，更具体描述待补充。
具体实现见：https://github.com/Alnlll/ML/tree/master/lr

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。