# 数据读取
import pandas as pd
df=pd.read_excel('../data/regression.xlsx',index_col='分行编号')
# 设置字体
from pylab import mpl
mpl.rcParams['font.sans-serif']=['FangSong']
# ---散点图---
import matplotlib.pyplot as plt
fig,ax=plt.subplots()
x=df['各项贷款余额'] # 设置横纵坐标
y=df['不良贷款']
ax.scatter(x,y,alpha=0.5) # alpha:设置透明度
ax.set_xlabel('各项贷款余额') # 设置x轴标签
ax.set_ylabel('不良贷款') # 设置y轴标签
plt.show() # 显示图像
#散点图矩阵
from pandas.plotting import scatter_matrix
scatter_matrix(df,figsize=(15,15),marker='o',alpha=0.5) # 设置大小、点的样式、透明度
plt.show()
【注意】散点图矩阵将两两变量绘制成散点图,中间对角线是变量的直方图
#相关系数
df.corr()
输出结果:
print(df.corr()['不良贷款']) # 获取指定列的相关系数
输出结果:
不良贷款 1.000000
各项贷款余额 0.843571
本年累计应收贷款 0.731505
贷款项目个数 0.700281
本年固定资产投资额 0.518518
Name: 不良贷款, dtype: float64
print(df['不良贷款'].corr(df['各项贷款余额'])) # 获取指定两项数据的相关性
输出结果:0.843571364359289
print("不良贷款与各项贷款余额之间的相关系数:{:.2f}".format(df['不良贷款'].corr(df['各项贷款余额']))) # 保留2位小数
输出结果:不良贷款与各项贷款余额之间的相关系数:0.84