python相关性分析可视化_Python实现 灰色关联分析 与结果可视化

之前在比赛的时候需要用Python实现灰色关联分析,从网上搜了下只有实现两个列之间的,于是我把它改写成了直接想Pandas中的计算工具直接计算person系数那样的形式,可以对整个矩阵进行运算,并给出了可视化效果,效果请见实现

灰色关联分析法

对于两个系统之间的因素,其随时间或不同对象而变化的关联性大小的量度,称为关联度。在系统发展过程中,若两个因素变化的趋势具有一致性,即同步变化程度较高,即可谓二者关联程度较高;反之,则较低。因此,灰色关联分析方法,是根据因素之间发展趋势的相似或相异程度,亦即“灰色关联度”,作为衡量因素间关联程度的一种方法。

简介

灰色系统理论提出了对各子系统进行灰色关联度分析的概念,意图透过一定的方法,去寻求系统中各子系统(或因素)之间的数值关系。因此,灰色关联度分析对于一个系统发展变化态势提供了量化的度量,非常适合动态历程分析。

计算步骤确实参考数列与比较数列

对参考数列与比较数列进行无量纲化处理

计算关联系数,求关联度

此处我给出的是第三步的实现方式,无量纲化请自己处理.数据使用UCI的红酒质量数据集.

代码实现

下载数据import pandas as pdimport numpy as npimport matplotlib.pyplot as plt

%matplotlib inline# 定义下载数据的函数def ReadAndSaveDataByPandas(target_url = None,file_save_path = None ,save=False):

if target_url !=None:

target_url = ("http://archive.ics.uci.edu/ml/machine-learning-databases/wine-quality/winequality-red.csv")

if file_save_path != None:

file_save_path = "/home/fonttian/Data/UCI/Glass/glass.csv"

wine = pd.read_csv(target_url, header=0, sep=";") if save == True:

wine.to_csv(file_save_path, index=False) return wine# 从硬盘读取数据进入内存wine = pd.read_csv("/home/font/Data/UCI/WINE/wine.csv")

wine.head()

AAffA0nNPuCLAAAAAElFTkSuQmCC

实现灰色关联分析import pandas as pdfrom numpy import *def GRA_ONE(DataFrame,m=0):

gray= DataFrame #读取为df格式

gray=(gray - gray.min()) / (gray.max() - gray.min()) #标准化

std=gray.iloc[:,m]#为标准要素

ce=gray.iloc[:,0:]#为比较要素

n=ce.shape[0]

m=ce.shape[1]#计算行列

#与标准要素比较,相减

a=zeros([m,n]) for i in range(m): for j in range(n):

a[i,j]=abs(ce.iloc[j,i]-std[j]) #取出矩阵中最大值与最小值

c=amax(a)

d=amin(a) #计算值

result=zeros([m,n]) for i in range(m): for j in range(n):

result[i,j]=(d+0.5*c)/(a[i,j]+0.5*c) #求均值,得到灰色关联值

result2=zeros(m) for i in range(m):

result2[i]=mean(result[i,:])

RT=pd.DataFrame(result2) return RTdef GRA(DataFrame):

list_columns = [str(s) for s in range(len(DataFrame.columns)) if s not in [None]]

df_local = pd.DataFrame(columns=list_columns) for i in range(len(DataFrame.columns)):

df_local.iloc[:,i] = GRA_ONE(DataFrame,m=i)[0] return df_localdata_wine_gra = GRA(wine)# data_wine_gra.to_csv(path+"GRA.csv") 存储结果到硬盘data_wine_gra123Empty DataFrame

Columns: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11]

Index: []

AAffA0nNPuCLAAAAAElFTkSuQmCC

结果可视化# 灰色关联结果矩阵可视化import seaborn as sns

%matplotlib inlinedef ShowGRAHeatMap(DataFrame):

import matplotlib.pyplot as plt import seaborn as sns

%matplotlib inline

colormap = plt.cm.RdBu

plt.figure(figsize=(14,12))

plt.title('Pearson Correlation of Features', y=1.05, size=15)

sns.heatmap(DataFrame.astype(float),linewidths=0.1,vmax=1.0, square=True, cmap=colormap, linecolor='white', annot=True)

plt.show()

ShowGRAHeatMap(data_wine_gra)

AAffA0nNPuCLAAAAAElFTkSuQmCC

参考文章

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值