数字设计—原理与实践(第4版)_机器学习第4篇——线性回归2（原理和实践）

weixin_39912566

于 2020-11-24 07:11:50 发布

阅读量166

点赞数

文章标签：数字设计—原理与实践(第4版)

本文详细介绍了线性回归的概念，包括简单线性回归的公式推导、最小二乘法的应用以及多元回归的原理。通过求解损失函数的偏导数，得到参数的最优解。此外，还讨论了在X矩阵不满秩情况下的正则化处理。最后，提到了线性回归的编程实现和实践应用。

摘要由CSDN通过智能技术生成

上一篇：相对静止：机器学习第1.5篇——线性回归（基础概念）介绍了相关的关键概念

本篇主要介绍简单线性回归的公式推导和编程实践

本文大纲

1.简单线性回归及最小二乘法的公式推导

一元线性回归方程：

1元线性回归方程

损失函数：使用几何上欧式距离的平方和——方差和

方差公式

求解两个参数：最小化损失SE

求解两个参数的方程

求解过程：

在损失函数中分别对两个参求偏导，并让偏导等于0（凸函数最优解）

分别求偏导

会得到包含2个参数的2个方程（方程组对应矩阵为正定矩阵？），可以求得唯一解，综合以上两式可得（偏导等于0）：

2.多元回归方程

目标函数为：

方程组对应的矩阵（d为属性维度，m为数据集行数）

将参数也用矩阵形式表示:

所以原式可表示为：

损失可表示为（根据矩阵运算规则）：

损失函数（Y表示样本实际结果）

啥运算规则，还需要补课

对参数求偏导可得：

令偏导为0，可求出参数值：

然而，现实任务中然而，现实任务中 xTx 往往不是满秩矩阵.例如在许多任务中我们会遇到大量的变量，其数目甚至超过样例数，导致 X 的列数多于行数， xTx 显然不满秩。此时可解出多个解，它们都能使均方误差最小化。选择哪一个解作为输出，将由学习算法的归纳偏好决定，常见的做法是引入正则化 (regularization)项. ——《机器学习》周志华 P56

3.线性回归代码实现

略过手撕代码

4.线性回归实践

# 数据集下载：参考资料5

5.进阶探讨的问题

正则化的作用
尝试其它模型（岭回归、决策树、随机森林等）

参考资料：

《机器学习》.周志华第三章
机器学习(1)-西瓜书-线性回归
线性回归损失函数求解
sklearn官方文档：LinearRegression
数据集及其相关字段说明

下一篇：

相对静止：机器学习第5篇——最优化方法（梯度下降发）zhuanlan.zhihu.com

weixin_39912566

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。