皮尔逊相关系数(Pearson Correlation Coefficient)

本文介绍了皮尔逊相关系数及其在衡量变量间线性相关性中的应用,通过Pandas库展示了计算方法。同时,文章讨论了最小二乘线性拟合的局限性,以及为了解决这些问题引入的岭回归和LASSO回归,这两种方法通过正则化防止过拟合并提高模型解释性。
摘要由CSDN通过智能技术生成

皮尔逊相关系数(Pearson Correlation Coefficient)


皮尔逊相关系数(Pearson Correlation Coefficient)通常用于度量两个变量 XX 和 YY 之间的线性相关程度,其值介于 -1 与 1 之间。其中,数值越趋近于 1 表示正相关程度越高,趋近于 0 表示线性相关度越低,趋近于 -1 则表示负相关程度越高。

Pandas 提供了直接计算相关系数的方法,从而计算出上方 10×1010×10 的希尔伯特矩阵中,数据列之间的相关性系。

import pandas as pd

pd.DataFrame(x, columns=['x%d'%i for i in range(1,11)]).corr()

最小二乘线性拟合¶
上面由希尔伯特矩阵对应的示例数据集中,假设已知的 x1x1 到 x10x10 服从线性分布:

y=w1∗x1+w2∗x2+……+w10∗x10(7)
(7)y=w1∗x1+w2∗x2+……+w10∗x10
接下来我们先使用 NumPy 随机生成 ww 参数,并得到实际对应的 yy 值。


                
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值