SPSS(二)

本文介绍了如何使用Python进行数据预处理,包括读取CSV文件,并通过计算皮尔逊相关系数来分析数据集中的变量间关系。作者还展示了如何创建相关系数的热力图,以直观展示变量间的相关性。
摘要由CSDN通过智能技术生成

在这一部分,我采用了多元线性回归分析。以下是具体的论文,文档将会在成绩下来后发出。

6525c32007e845b594c75eb596325164.jpg

并通过python进行了数据可视化分析,以下是具体代码和热力图

# -*- coding: utf-8 -*-

# 读取csv文件

import pandas as pd

import seaborn as sns

import matplotlib.pyplot as plt

#这里改路径,记得将文件单元格形式,改成数值型

filepath = 'D:\i4Tools8\数据河北.csv'

data = pd.read_csv(filepath,encoding='gbk')

df = pd.DataFrame(data)

# 计算出相关系数并输出,这里选择的是皮尔逊相关系数

cor = data.corr(method='pearson')

print(cor) # 输出相关系数

rc = {'font.sans-serif': 'SimHei',

      'axes.unicode_minus': False}

sns.set(font_scale=0.7,rc=rc) # 设置字体大小

sns.heatmap(cor,

            annot=True, # 显示相关系数的数据

            center=0.5, # 居中

            fmt='.2f', # 只显示两位小数

            linewidth=0.5, # 设置每个单元格的距离

            linecolor='green', # 设置间距线的颜色

            vmin=0, vmax=1, # 设置数值最小值和最大值

            xticklabels=True, yticklabels=True, # 显示x轴和y轴

            square=True, # 每个方格都是正方形

            cbar=True, # 绘制颜色条

             #这里设置颜色

            cmap='coolwarm_r', # 设置热力图颜色

            )

plt.savefig("相关热力图.png",dpi=600)#保存图片,分辨率为600

plt.ion() #显示图片14f4052e36914329a761d62131ec9762.png

66c0bb6fdaf04823bb1ba300b612c1c4.png

 

 

  • 5
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值