机器学习局部加权回归及Python简单实现

最新推荐文章于 2024-08-07 10:58:50 发布

ShiZhanfei

最新推荐文章于 2024-08-07 10:58:50 发布

阅读量1.7k

点赞数 1

分类专栏：机器学习

本文链接：https://blog.csdn.net/ShiZhanfei/article/details/84704371

版权

本文探讨了欠拟合与过拟合的概念，引出局部加权回归作为解决方法。介绍了局部加权回归的原理，包括权重函数的作用和梯度下降的迭代过程，并提供了一个简单的Python实现示例。最后从概率论角度解释了损失函数采用平方差的原因。

摘要由CSDN通过智能技术生成

一、欠拟合与过拟合

加入对给定的一组样本x_i和真实值y_i，假如合适的特征应选为x1=x_i，x2=x_i²，预测值 $h\theta(x_i)$ = $\sum_{i=0}^{i=2}\theta_i x_i$ = $\theta_0+\theta_1 x_i+\theta_2 x_i^2$ ，这样拟合出的曲线较为合适。则若把特征选为x1=x_i，预测值 $h\theta(x_i)$ = $\sum_{i=0}^{i=1}\theta_i x_i$ = $\theta_0+\theta_1 x_i$ ，就会丢失二次项，预测曲线与输入值的真实值可能会有较大的误差。此类拟合方式称为欠拟合。
而若把特征选为x1=x_i，x2=x_i²…x6=x_i⁶，预测值 $h\theta(x_i)$ = $\sum_{i=0}^{i=6}\theta_i x_i$ = $\theta_0+\theta_1 x_i+\theta_2 x_i^2...+\theta_6 x_i^6$ ，则对于给定的样本，预测曲线几乎完美符合。这是因为当特征数量较大，甚至大到与样本数量较接近时，接近直接解出多元高次方程，损失函数几乎失去意义。这会导致虽然预测曲线完美符合训练样本，但样本外的一般性输入，预测值会与真实值偏差值极大。此类拟合称为过拟合。
因此梯度下降等参数学习需要合适选取特征集，避免欠拟合和过拟合。

二、局部加权的原因

梯度下降回归多元线性回归的预测值 $h_\theta(x)$ 为 $\sum_{i=0}^{i=n}\theta_i x_i$ （定义 $x_0$ =1，有x1~xn共n个特征)。
当要计算一个给定的检测点 $\hat{x_k}$ 的预测值时，多元线性回归会先求出使 $\frac{1}{2}\sum_{i=1}^{i=m}(h_\theta(x_i)-y_i)^2$ 即m个样本的损失函数最小的 $\hat\theta$ = $[\theta_0,\theta_1...\theta_n]^T$

最低0.47元/天解锁文章

ShiZhanfei

关注

1
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
机器学习局部加权回归及Python简单实现

一、欠拟合与过拟合加入对给定的一组样本xi和真实值yi，假如合适的特征应选为x1=xi，x2=xi2，预测值hθ(xi)h\theta(x_i)hθ(xi)=∑i=0i=2θixi\sum_{i=0}^{i=2}\theta_i x_i∑i=0i=2θixi=θ0+θ1xi+θ2xi2\theta_0+\theta_1 x_i+\theta_2 x_i^2θ0+θ1xi+θ2xi...
复制链接

扫一扫