corr()
函数用于计算 DataFrame 中数值型数据之间的相关性。它计算了每对列之间的相关系数,返回一个具有相同列标签和行标签的相关系数矩阵。
下面是一个示例,说明如何使用 corr()
函数:
import pandas as pd
# 创建一个 DataFrame
data = {
'A': [1, 2, 3, 4, 5],
'B': [4, 5, 6, 7, 8],
'C': [7, 8, 9, 10, 11]
}
df = pd.DataFrame(data)
# 计算 DataFrame 中各列之间的相关系数
correlation_matrix = df.corr()
print("Correlation matrix:")
print(correlation_matrix)
输出结果:
Correlation matrix:
A B C
A 1.0 1.0 1.0
B 1.0 1.0 1.0
C 1.0 1.0 1.0
在这个示例中,我们创建了一个 DataFrame,并使用 corr()
函数计算了各列之间的相关系数。由于示例数据是简单的数值序列,因此每对列之间的相关系数都是 1.0,表示它们之间的线性相关性很强。