数据探索:相关性分析

# 数据读取 
import pandas as pd

df=pd.read_excel('../data/regression.xlsx',index_col='分行编号')
# 设置字体
from pylab import mpl

mpl.rcParams['font.sans-serif']=['FangSong']
# ---散点图---
import matplotlib.pyplot as plt

fig,ax=plt.subplots()
x=df['各项贷款余额']   # 设置横纵坐标
y=df['不良贷款']
ax.scatter(x,y,alpha=0.5)    # alpha:设置透明度
ax.set_xlabel('各项贷款余额') # 设置x轴标签
ax.set_ylabel('不良贷款')     # 设置y轴标签
plt.show()                   # 显示图像

#散点图矩阵
from pandas.plotting import scatter_matrix

scatter_matrix(df,figsize=(15,15),marker='o',alpha=0.5)  # 设置大小、点的样式、透明度
plt.show()

【注意】散点图矩阵将两两变量绘制成散点图,中间对角线是变量的直方图

 

#相关系数
df.corr()

输出结果:

print(df.corr()['不良贷款'])  # 获取指定列的相关系数
输出结果:
不良贷款         1.000000
各项贷款余额       0.843571
本年累计应收贷款     0.731505
贷款项目个数       0.700281
本年固定资产投资额    0.518518
Name: 不良贷款, dtype: float64
print(df['不良贷款'].corr(df['各项贷款余额']))  # 获取指定两项数据的相关性
输出结果:0.843571364359289
print("不良贷款与各项贷款余额之间的相关系数:{:.2f}".format(df['不良贷款'].corr(df['各项贷款余额']))) # 保留2位小数

 输出结果:不良贷款与各项贷款余额之间的相关系数:0.84

  • 0
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值