python 计算相关性系数np.corrcoef()

计算相关性是分析连续型与连续型双变量的常用方法,散点图只能直观的显示双变量(特征)之间的关系,但并不能说明关系的强弱,而相关性可以对变量之间的关系进行量化分析。
 
相关性系数的公式如下:
在这里插入图片描述
相关性系数的取值区间为[-1,1]。当相关性系数为-1时,表示强负线性相关;当相关性系数为1时,表示强正相关;当相关性系数为0时,表示不相关。
一般来说,在取绝对值后,0-0.09为没有相关性,0.1-0.3为弱相关,0.3-0.5为中相关,0.5-0.1为强相关。

# 修改pandas默认的现实设置
import numpy as np
import pandas as pd
pd.set_option('display.max_columns', 10)
pd.set_option('display.max_rows', 20)

# 相关性系数
# 一般来说,在取绝对值后,0~0.09为没有相关性,0.1~0.3为弱相关,
# 0.3~0.5为中等相关,0.5~1.0为强相关.
X = np.array([65, 72, 78, 65, 72, 70, 65, 68])
Y = np.array([72, 69, 79, 69, 84, 75, 60, 73])
print(np.corrcoef(X, Y))

运行结果:

[[1.         0.64897259]
 [0.64897259 1.        ]]
  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 的作用是什么? np.corrcoef函数是用于计算两个向量之间的相关系数矩阵的函数。它将两个向量作为输入并返回相关系数矩阵。相关系数矩阵描述了向量之间的线性关系,其值在-1到1之间。相关系数为1表示完全的正相关,相关系数为-1表示完全的负相关,相关系数为0表示没有线性关系。 ### 回答2: np.corrcoef函数是NumPy库中的一个函数,用于计算两个数组之间的相关系数。 相关系数是用来衡量两个变量之间关联程度的一种统计指标。它的取值范围在-1到1之间,-1表示完全的负相关,1表示完全的正相关,0表示无相关。相关系数的绝对值越接近1,表示两个变量之间的关联程度越强。 np.corrcoef函数的使用方法是 np.corrcoef(x, y),其中x和y是两个一维数组。函数会返回一个2x2的相关系数矩阵,矩阵的对角线元素分别是x和y的相关系数,非对角线元素是它们的交叉相关系数。 如果x和y的长度不一致,函数会引发一个错误。另外,如果x或y的方差为0,函数也会引发一个错误。 下面是一个例子,展示了np.corrcoef函数的用法: ```python import numpy as np x = np.array([1, 2, 3, 4, 5]) y = np.array([2, 4, 6, 8, 10]) correlation_matrix = np.corrcoef(x, y) correlation_coefficient = correlation_matrix[0, 1] print(correlation_matrix) print(correlation_coefficient) ``` 此例中,输入的x和y是两个长度为5的一维数组。np.corrcoef函数计算得到的相关系数矩阵是: ``` [[1. 1.] [1. 1.]] ``` 相关系数矩阵的对角线元素都是1,表示x和x、y和y之间的相关系数为1。非对角线元素是1,表示x和y之间的相关系数也是1。 通过打印correlation_coefficient,可以得到x和y之间的相关系数,结果是1。 总之,np.corrcoef函数提供了计算相关系数的功能,方便我们衡量两个数组之间的关联程度。 ### 回答3: np.corrcoef函数是numpy库中用于计算相关系数的函数。相关系数是用来衡量两个变量之间线性相关关系强度的指标。np.corrcoef函数接受一个向量或矩阵作为参数,并返回一个相关系数矩阵。 对于一个向量x,np.corrcoef(x)将返回一个2x2的矩阵。矩阵的对角线上的元素是x的相关系数,即x与自身的相关系数,一般为1,表示完全相关。非对角线元素是x与x的不同部分之间的相关系数。 对于一个m*n的矩阵X,np.corrcoef(X)将返回一个nxn的相关系数矩阵。相关系数矩阵的(i,j)元素是矩阵X的第i列与第j列之间的相关系数。这可以用于分析矩阵中不同变量之间的相关性。 需要注意的是,np.corrcoef函数默认使用皮尔逊相关系数计算相关性。皮尔逊相关系数衡量的是两个变量之间的线性相关性,取值范围为-1到1。当相关系数接近1时,表示呈正相关,即变量随着另一个变量的增加而增加。当相关系数接近-1时,表示呈负相关,即变量随着另一个变量的增加而减少。当相关系数接近0时,表示两个变量之间没有线性相关关系。 总结起来,np.corrcoef函数是numpy库中用于计算相关系数的函数,可以用于分析变量之间的线性相关性。它能够接受向量或矩阵作为输入,并返回相关系数矩阵。通过计算相关系数,我们可以了解变量之间的相关关系,从而进行更深入的数据分析。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值