今天用python计算了下相关系数矩阵,代码如下:
import pandas as pd
sale_data = 'e:/data.xlsx'
df = pd.read_excel(sale_data, index_col='SPBM')
df2 = pd.DataFrame(df.values.T, index=df.columns, columns=df.index)
df3 = df2.corr()
print(df3.head())
df3.to_excel('e:/data2.xlsx')
其中data.xlsx是商品销售数据,第一列为商品编码,其他列为一年十二个月每个月的销售额,我想知道这些商品的销售额有没有什么相关性,于是用了Python来计算。
其中df2是为了把数据给转置过来,因为我发现corr只能计算列的相关系数,而我需要计算行的相关系数。