线性回归算法梳理

最新推荐文章于 2024-05-20 10:52:18 发布

thereishudi

最新推荐文章于 2024-05-20 10:52:18 发布

阅读量337

点赞数

分类专栏：初级算法梳理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/thereishudi/article/details/88888067

版权

文章目录

线性回归算法梳理

线性回归算法梳理

机器学习的一些概念

监督学习：通过已有的一部分输入数据和输出数据的对应关系来生成一个函数模型，将未来的输入映射到对应的输出。例如分类问题和回归问题。训练监督学习的数据集是已经标注好的数据集。

无监督学习：通过对原始的数据进行分类来给数据添加标签，无监督学习并不关心分类的类别。典型的无监督学习例子为聚类算法。

泛化能力：是指已经训练好的模型对新的数据进行识别的能力。类似于举一反三的能力。

过拟合 ：模型的复杂度很高，对于训练数据拟合的很好，但是由于模型复杂度高于实际模型而导致泛化能力很差。

欠拟合 ：欠拟合和过拟合是相对的，模型复杂度低于实际的情况，对训练数据拟合效果很差而导致泛化能力很差。
图片来自吴恩达机器学习
交叉验证（Cross Validation）：有的时候也称作循环估计（Rotation Estimation），是一种统计学上将数据样本切割成较小子集的实用方法，该理论是由Seymour Geisser提出的。
在给定的建模样本中，拿出大部分样本进行建模型，留小部分样本用刚建立的模型进行预报，并求这小部分样本的预报误差，记录它们的平方加和。这个过程一直进行，直到所有的样本都被预报了一次而且仅被预报一次。把每个样本的预报误差平方加和，称为PRESS(predicted Error Sum of Squares)。
用交叉验证的目的是为了得到可靠稳定的模型。

线性回归原理

线性回归：给定由d个属性描述的示例 $x=(x_1;x_2;x_3 ...;x_d)$ ，其中 $x_i$ 是 $x$ 在第 $i$ 个属性上的取值，线性模型试图学的一个通过属性的线性组合来预测函数，即 $f(x)=w_1x_1+w_2x_2+w_3x_3+...+w_dx_d+b$
用向量表示为 $f(x)=w^Tx+b$

线性回归是给定数据集 $D={(x_1,y_1),(x_2,y_2),...,(x_m,y_m)}$

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
线性回归算法梳理

文章目录线性回归算法梳理机器学习的一些概念线性回归原理损失函数，代价函数与目标函数线性回归优化方法线性回归评价指标sklearn参数详解参考文档线性回归算法梳理机器学习的一些概念监督学习：通过已有的一部分输入数据和输出数据的对应关系来生成一个函数模型，将未来的输入映射到对应的输出。例如分类问题和回归问题。训练监督学习的数据集是已经标注好的数据集。无监督学习：通过对原始的数据进行分类来给数据...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。