机器学习实战（7）：线性回归

最新推荐文章于 2023-08-22 13:13:16 发布

白噪声序列

最新推荐文章于 2023-08-22 13:13:16 发布

阅读量543

点赞数

分类专栏：机器学习 Python

本文链接：https://blog.csdn.net/weixin_43565540/article/details/108222183

版权

Python 同时被 2 个专栏收录

15 篇文章 1 订阅

订阅专栏

机器学习

8 篇文章 1 订阅

订阅专栏

一、普通线性回归

用最小二乘法求线性回归的系数估计已经是老生常谈了，这里直接看看怎么使用Numpy库中的矩阵方法来实现：
在这里插入图片描述

二、局部加权线性回归

使用普通最小二乘法可能会导致欠拟合，即模型过于照顾方差较大的点，而忽略了对方差较小点的拟合效果，这里可以使用局部加权线性回归： $\hat{w} = (X'WX)^{-1}X'Wy$ 其中 $W$ 是对角矩阵。局部加权线性回归使用核，使得在估计自变量某个取值对因变量影响时，该自变量取值附近的数据的权重更高。常用的核为高斯核： $exp\lgroup \frac{|x^{(i)}- x|}{-2k^2} \rgroup$
在这里插入图片描述
该函数可以对输入空间中的任一点，计算出对应的预测值，且在计算过程中实现了随样本点与待预测点距离的递增，权重以指数级递减。
再创建一个函数，为数据集中的每个点调用函数lwlr，直观判断当k不同时函数的拟合效果：
在这里插入图片描述
一般来说当 $k = 1.0$ 时，得到的结果与最小二乘结果比较接近，有可能造成欠拟合， $k$ 越小，对样本集的拟合效果越好，当 $k$ 过小时，容易发生过拟合。

三、shrinkage方法

所谓shrinkage方法就是在最小二乘估计式中引入惩罚项，控制模型的复杂度，从而可以减少不必要的参数。
最常用的方法就是岭回归，相当于在残差平方和式中加入了 $L 2$ 范数，回归系数估计式为 $\hat{w} = (X'X +\lambda I)^{-1}X'y$
在这里插入图片描述
上式是默认在 $l a m d a = 0.2$ 时进行岭回归，接下来编写测试函数，在不同的 $l a m d a$ 下分别调用ridgeRegress函数，选择最优的调和系数。

要定量确定岭回归系数，最好使用交叉验证法：

白噪声序列

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
机器学习实战（7）：线性回归

一、普通线性回归用最小二乘法求线性回归的系数估计已经是老生常谈了，这里直接看看怎么使用Numpy库中的矩阵方法来实现：二、局部加权线性回归使用普通最小二乘法可能会导致欠拟合，即模型过于照顾方差较大的点，而忽略了对方差较小点的拟合效果，这里可以使用局部加权线性回归：w^=(X′WX)−1X′Wy\hat{w} = (X'WX)^{-1}X'Wyw^=(X′WX)−1X′Wy其中WWW是对角矩阵。局部加权线性回归使用核，使得在估计自变量某个取值对因变量影响时，该自变量取值附近的数据的权重更高。常用的核为
复制链接

扫一扫