岭回归

最新推荐文章于 2024-04-25 15:44:35 发布

爱哭的猫ff

最新推荐文章于 2024-04-25 15:44:35 发布

阅读量692

点赞数 2

分类专栏：算法机器学习预测有监督学习文章标签：机器学习监督学习算法 Python 岭回归

本文链接：https://blog.csdn.net/zhangpengfei104/article/details/50876366

版权

算法同时被 3 个专栏收录

29 篇文章 0 订阅

订阅专栏

机器学习

24 篇文章 0 订阅

订阅专栏

有监督学习

19 篇文章 0 订阅

订阅专栏

对于样本数据的特征比数据样本点还多的数据我们就没有办法使用标准线性回归和局部加权线性回归来计算，因为没有办法对矩阵求逆。所以这一小节我们引入岭回归来处理这种数据，当然岭回归也可以处理普通的数据。回归系数的计算公式：

在这个公式中我们加入了一项：

进而就可以对矩阵求逆，

是用户指定的值，

是一个单位矩阵，通过引入该项可以减少不重要的参数。了解了公式我们就来分析一下代码：

def ridgeRegres(xMat,yMat,lam=0.2):
    xTx = xMat.T*xMat
    denom = xTx + eye(shape(xMat)[1])*lam
    if linalg.det(denom) == 0.0:
        print "This matrix is singular, cannot do inverse"
        return
    ws = denom.I * (xMat.T*yMat)
    return ws
    
def ridgeTest(xArr,yArr):
    xMat = mat(xArr); yMat=mat(yArr).T
    yMean = mean(yMat,0)
    yMat = yMat - yMean    
    #regularize X's
    xMeans = mean(xMat,0)   
    xVar = var(xMat,0)      
    xMat = (xMat - xMeans)/xVar
    numTestPts = 30
    wMat = zeros((numTestPts,shape(xMat)[1]))
    for i in range(numTestPts):
        ws = ridgeRegres(xMat,yMat,exp(i-10))
        wMat[i,:]=ws.T
    return wMat

第一个函数用于计算回归系数，就是上面公式的实现，输入参数分别为训练数据集和标签数据集。以及lam值，如果用户不指定就会默认为0.2.接下来分析第二个函数，首先为了能够岭回归和缩减技术首先要对特征做标准化处理。使每维的特征具有同等重要性。接下来要进行30次调用上面的函数求解回归系数，当然我们也可以自己定义调用次数。最后返回所有的回归系数，我们就可以在这些回归系数中挑选最好的。

爱哭的猫ff

关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
岭回归

对于样本数据的特征比数据样本点还多的数据我们就没有办法使用标准线性回归和局部加权线性回归来计算，因为没有办法对矩阵求逆。所以这一小节我们引入岭回归来处理这种数据，当然岭回归也可以处理普通的数据。回归系数的计算公式：在这个公式中我们加入了一项：进而就可以对矩阵求逆，是用户指定的值，是一个单位矩阵，通过引入该项可以减少不重要的参数。了解了公式我们就来分析一下代码：def r
复制链接

扫一扫

专栏目录