Python使用Pandas计算相关系数

问题:

  • 给定成分数据,使用Pandas计算各成分之间的相关系数

代码

  • 调用函数:pandas.corr()
1、单个文件的情况
import pandas as pd

# 指定文件名称,这里假设数据文件data.csv与此文件位于相同的目录
file_name = './data.csv'

# 读取数据文件
data = pd.read_csv(file_name)

# 可以通过打印数据表的行、列信息以级前几行来简单的了解数据
# print(data.shape)
# print(data.head())

# 调用corr()函数计算数据列之间的相关系数
corr = data.corr();

# 把相关系数结果存储到新的文件中,路径默认为当前文件夹 
corr.to_csv('correlation.csv')
2、多个文件的情况
import pandas as pd

# 指定数据文件的路径 
file_name_1 = '../dic1/dic2/name1.csv'
file_name_2 = '../dic1/dic2/name2.csv'
file_name_3 = '../dic1/dic2/name3.csv'
file_name_4 = '../dic1/dic2/name4.csv'

# 将数据文件的路径统一到列表中
lists = {file_name_1, file_name_2, file_name_3, file_name_4}

# 使用循环来对数据文件逐个操作
for file_name in lists:
    # 读取数据文件
    data = pd.read_csv(file_name)
    
    # 计算数据列之间的相关系数
    corr = data.corr();
    
    # 为了区分不同的文件计算得到的相关系数,此处通过数据文件名做区分,用split()函数截取原始的数据文件名
    out_name = file_name.split('/')[3]
    
    # 将每个数据文件的相关系数计算结果存储到当前路径下,文件名以“correlation与文件名”做拼接
    corr.to_csv('./correlation_' + out_name)
  • 1
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值