np.linalg.lstsq()进行线性回归拟合

最新推荐文章于 2024-04-27 10:21:04 发布

易冷cheng

最新推荐文章于 2024-04-27 10:21:04 发布

阅读量3.7k

点赞数 1

分类专栏： python numpy 文章标签： python 线性代数

本文链接：https://blog.csdn.net/qq_41092406/article/details/120062910

版权

python 同时被 2 个专栏收录

9 篇文章 1 订阅

订阅专栏

numpy

1 篇文章 0 订阅

订阅专栏

np.linalg.lstsq()进行线性回归拟合

1.函数意义

明确这个函数的原义是用来求超定线性方程组的：

系数矩阵的第一列相当于给定了x的观测值 X=[0,1,2,3].transpose

右边的结果矩阵相当于给定了y的观测值 Y=[-1,0.2,0.9,2.1].transpose

然后使用两个观测值来拟合经验函数 y=mx+c

系数矩阵的第二列存在的意义有点类似于机器学习中的偏置θ0,用于和C相乘，注意这是必要的，在只给定观测值的情况下，我们也常常需要np.ones_like(X的长度来构建有这一“无效列”的矩阵.

2.函数参数详解

**lstsq(a,b,rcond=“warn”)**函数的参数详解（下面的矩阵都是array_like(类数组对象))：

a是一个M行N列的系数矩阵，前面说过需要构造np.ones_like(M)
b是一个(M,)或者(M,K)，如果b是一个M行K列的二维矩阵，函数会逐个计算每一列的最小二乘法
rcond这个参数是可选的，是用于奇异矩阵的处理的，感兴趣的可以自行查看源码，官方推荐我们一般用 rcond=None

**返回值：**以下提到的所有矩阵都是ndarray, NumPy 最重要的一个特点是其 N 维数组对象 ndarray，它是一系列同类型数据的集合，以 0 下标为开始进行集合中元素的索引）：

x : {(N,), (N, K)} ndarray

(如果前面的b是二维的，那么这里也会有k列的a和b结果)
residuals : {(1,), (K,), (0,)} ndarray
rank: int
a 的奇异值

返回值重点关注返回集合中的x就行，所以我们一般的用法是lstsq()[0]

Examples

Fit a line, y = mx + c, through some noisy data-points:


>>> x = np.array([0, 1, 2, 3])
>>> y = np.array([-1, 0.2, 0.9, 2.1])

By examining the coefficients, we see that the line should have a gradient of roughly 1 and cut the y-axis at, more or less, -1.
We can rewrite the line equation as y = Ap, where A = [[x 1]] and p = [[m], [c]]. Now use lstsq to solve for p:

>>> A = np.vstack([x, np.ones(len(x))]).T
>>> A
array([[ 0.,  1.],
       [ 1.,  1.],
       [ 2.,  1.],
       [ 3.,  1.]])
>>> m, c = np.linalg.lstsq(A, y, rcond=None)[0]
>>> m, c
(1.0 -0.95) # may vary

Plot the data along with the fitted line:

>>> import matplotlib.pyplot as plt
>>> _ = plt.plot(x, y, 'o', label='Original data', markersize=10)
>>> _ = plt.plot(x, m*x + c, 'r', label='Fitted line')
>>> _ = plt.legend()
>>> plt.show()