皮尔逊相关系数(Pearson Correlation Coefficient)
¶
皮尔逊相关系数(Pearson Correlation Coefficient)通常用于度量两个变量 XX 和 YY 之间的线性相关程度,其值介于 -1 与 1 之间。其中,数值越趋近于 1 表示正相关程度越高,趋近于 0 表示线性相关度越低,趋近于 -1 则表示负相关程度越高。
Pandas 提供了直接计算相关系数的方法,从而计算出上方 10×1010×10 的希尔伯特矩阵中,数据列之间的相关性系。
import pandas as pd
pd.DataFrame(x, columns=['x%d'%i for i in range(1,11)]).corr()
最小二乘线性拟合¶
上面由希尔伯特矩阵对应的示例数据集中,假设已知的 x1x1 到 x10x10 服从线性分布:
y=w1∗x1+w2∗x2+……+w10∗x10(7)
(7)y=w1∗x1+w2∗x2+……+w10∗x10
接下来我们先使用 NumPy 随机生成 ww 参数,并得到实际对应的 yy 值。