机器学习——回归算法之最小角回归（Least angle regression， LARS）

最新推荐文章于 2024-07-16 13:21:27 发布

macan_dct

最新推荐文章于 2024-07-16 13:21:27 发布

阅读量2.6k

点赞数 2

分类专栏：机器学习算法文章标签：机器学习最小角回归

本文链接：https://blog.csdn.net/weixin_42211626/article/details/100712135

版权

机器学习算法专栏收录该内容

18 篇文章 3 订阅

订阅专栏

机器学习——回归算法之最小角回归（Least angle regression， LARS）

前言

最小角回归涉及到了相关系数（current correlations）,但这里并不会具体定义相关系数的定义，只需要在知道它是用来衡量两个变量相关程度的就可以了。

算法思想

这里用一张图来说明算法的基本思想：
$从简单的情况说明，假设有两个样本x_{1}和x_{2}，真实标签为\hat{y_{2}}(图中绿色的，请自行屏蔽绿色的\hat {y_{1}}因为它对于说明算法思想每啥用)$
$算法从\hat{ \mu_{0}}=0开始，从图中也可以看出，\hat{y_{2}}- \hat{\mu_{0}}显然比x_{2}更靠近x_{1}，这个“靠近程度”使用相关系数来衡量的，即：$
$c_{1}(\hat{\mu_{0}})=x_{1}(\hat{y_{2}}-\hat{\mu_{0}})\tag{1}$
$c_{2}(\hat{\mu_{0}})=x_{2}(\hat{y_{2}}-\hat{\mu_{0}})\tag{2}$
$c_{1}(\hat{\mu_{0}})>c_{2}(\hat{\mu_{0}})\tag{3}$
于是算法会沿着 $x_{1}$ 走一步，走多大呢？这里有个公式（ $\gamma_{1}可以看成是步长$ ）：
$\hat{\mu_{1}}=\hat{\mu_{0}}+\hat{\gamma_{1}}x_{1}\tag{4}$
然后再计算:
$c_{1}(\mu_{1})=x_{1}(\hat{y_{2}}-\hat{\mu_{1}})\tag{5}$
$c_{2}(\mu_{1})=x_{2}(\hat{y_{2}}-\hat{\mu_{1}})\tag{6}$
发现此时：
$c_{1}(\mu_{1})=c_{2}(\mu_{1})\tag{7}$

怎么解释上面的等式？看图，将 $x_{2}向右平移到\hat{\mu_{1}}处，\hat{y_{2}} - \hat{\mu_{1}}可以看成平分x_{1}和x_{2}之间的夹角。$
$\hat{y_{2}}-\hat{\mu_{1}}是坐落在单位向量\mu_{2}的方向上的$ ，那么下一步的更新方向是： $\hat{\mu_{2}}=\hat{\mu_{1}}+\hat{\gamma_{2}}\mu_{2}$
在两个样本的情况下， $\hat{\gamma_{2}}$ 是需要选择合适的大小（有两种选择算法可供选择 $\hat{\gamma_{}}$ ）使得 $\hat{\mu_{2}}=\hat{y_{2}}$ ，得到最终的线性回归结果。
在这里插入图片描述这里仅使用二维（两个样本）举例说明，高维情况也是如此。 $\hat{\gamma}$ 就是算法需要学习的参数，具体公式见此。LARS 和逐步回归很像。在每一步，它寻找与响应最有关联的预测。当有很多预测有相同的关联时，它没有继续利用相同的预测，而是在这些预测中找出应该等角的方向。
优点：

特别适合于特征维度n 远高于样本数m的情况。
算法的最坏计算复杂度和最小二乘法类似，但是其计算速度几乎和前向选择算法一样
可以产生分段线性结果的完整路径，这在模型的交叉验证中极为有用

缺点：

由于LARS的迭代方向是根据目标的残差而定，所以该算法对样本的噪声极为敏感。

示例代码

import numpy as np
import matplotlib.pyplot as plt
 
from sklearn import linear_model
from sklearn import datasets
 
diabetes = datasets.load_diabetes()
X = diabetes.data
y = diabetes.target
 
print("Computing regularization path using the LARS ...")
alphas, _, coefs = linear_model.lars_path(X, y, method='lasso', verbose=True)
 
xx = np.sum(np.abs(coefs.T), axis=1)
xx /= xx[-1]
 
plt.plot(xx, coefs.T)
ymin, ymax = plt.ylim()
plt.vlines(xx, ymin, ymax, linestyle='dashed')
plt.xlabel('|coef| / max|coef|')
plt.ylabel('Coefficients')
plt.title('LASSO Path')
plt.axis('tight')
plt.show()
##################################
#reg = linear_model.LassoLars(alpha)这块的alpha可使用前面返回的alphas

在这里插入图片描述

macan_dct

关注

2
点赞
踩
14

收藏

觉得还不错? 一键收藏
0
评论
机器学习——回归算法之最小角回归（Least angle regression， LARS）

机器学习——回归算法之最小角回归（Least angle regression， LARS）前言算法思想示例代码前言最小角回归涉及到了相关系数（current correlations）,但这里并不会具体定义相关系数的定义，只需要在知道它是用来衡量两个变量相关程度的就可以了。算法思想这里用一张图来说明算法的基本思想：从简单的情况说明，假设有两个样本x1和x2，真实标签为y2^(图中绿色的...
复制链接

扫一扫

专栏目录