【机器学习】线性回归+代码实现

最新推荐文章于 2024-05-20 10:52:18 发布

maershii

最新推荐文章于 2024-05-20 10:52:18 发布

阅读量1.5w

点赞数 11

分类专栏：机器学习

本文链接：https://blog.csdn.net/u013166817/article/details/84970546

版权

本文介绍了线性回归的基础，包括标准线性回归和局部加权线性回归，并探讨了过拟合问题，提出了岭回归、lasso回归和前向逐步回归作为解决方案。通过示例和代码实现，展示了如何在模型复杂性和泛化能力之间找到平衡。

摘要由CSDN通过智能技术生成

参考：《机器学习实战》
源码地址以及数据：https://github.com/JieruZhang/MachineLearninginAction_src

1. 标准线性回归(LR)

$\mathbf{y} = \mathbf{X}w + b$
$平方误差：\sum_{i=1}^N (y_i - x_i^Tw)^2$
$导数为零求得：\hat{w} = (\mathbf{X}^T\mathbf{X})^{-1}\mathbf{X}^Ty$
目标：最小平方误差。
注意，需要先判断矩阵是否可逆，判断方法：行列式不为零。

from numpy import *
import matplotlib.pyplot as plt

#读取数据
def loadDataSet(filename):
    numFeat = len(open(filename).readline().split('\t'))-1
    dataMat = []; labelMat = []
    fr = open(filename)
    for line in fr.readlines():
        lineArr = []
        curLine = line.strip().split('\t')
        for i in range(numFeat):
            lineArr.append(float(curLine[i]))
        dataMat.append(lineArr)
        labelMat.append(float(curLine[-1]))
    return dataMat, labelMat

#标准线性回归函数
def standRegres(xArr, yArr):
    xMat = mat(xArr)
    yMat = mat(yArr).T
    xTx = xMat.T * xMat
    #判断行列式为零，则无法求逆
    if linalg.det(xTx) == 0:
        print('the matrix is singular, cannot do inverse')
        return
    ws = (xTx).I * (xMat.T*yMat)
    return ws

#拟合数据
xArr, yArr = loadDataSet('ex0.txt')
ws = standRegres(xArr, yArr)
xMat = mat(xArr)
yMat = mat(yArr)
yHat = xMat*ws
fig = plt.figure()
ax = fig.add_subplot(111)
ax.scatter(xMat[:,1].flatten().A[0], yMat.T[:,0].flatten().A[0])
xCopy = xMat.copy()
xCopy.sort(0)
yHat = xCopy*ws
ax.plot(xCopy[:,1], yHat)
plt.show()

在这里插入图片描述

计算 $\hat{y}$ 和 $y$ 之间的相关系数，用来判断预测值和实际值的匹配程度。

yHat = xMat*ws
corrcoef(yHat.T, yMat)

array([[1.        , 0.97223133],
       [0.97223133, 1.        ]])

2. 局部加权线性回归(LWLR)

标准线性回归依据最小均方误差（MSE），则可能会导致欠拟合。因此可以在估计中加入偏差，降低预测的均方误差。
局部加权线性回归:给待遇测点附近每个点赋予一定的权重，然后继续进行最小均方差回归。设置一个权重矩阵 $W$ ,给每个数据点赋予一个权重。可以使用核来给附近的点赋予更大的权值，常用的是高斯核：
$exp(\frac{|x^(i) - x|}{-2k^2})$

最低0.47元/天解锁文章

maershii

关注

11
点赞
踩
104

收藏

觉得还不错? 一键收藏
3
评论
【机器学习】线性回归+代码实现

参考：《机器学习实战》源码地址以及数据：https://github.com/JieruZhang/MachineLearninginAction_src1. 标准线性回归(LR)y=Xw+b\mathbf{y} = \mathbf{X}w + by=Xw+b平方误差：∑i=1m(yi−xiTw)2平方误差：\sum_{i=1}^m (y_i - x_i^Tw)^2平方误差：i=1∑m(...
复制链接

扫一扫