日记篇-基于Diabetic Retinopathy数据集简单实现下相关数据的交叉报表和图形化交叉报表

糖尿病视网膜病变(Diabetic Retinopathy)是糖尿病性微血管病变中最重要的表现,是一种具有特异性改变的眼底病变,是糖尿病的严重并发症之一。基于Diabetic Retinopathy数据集[1]
数据是长这个模样的:

在这里插入图片描述

编写Python代码,制作x6和y,x7和y,x12和y及x13和y的交叉报表,图形化交叉报表,代码实现如下

from scipy.io import arff
import pandas as pd
import matplotlib.pyplot as plt
df = arff.loadarff("messidor_features.arff")
data = pd.DataFrame(df[0])
Cnames = ['x1', 'x2', 'x4', 'x5', 'x6', 'x7', 'x8', 'x9', 'x10', 'x11',
      'x12', 'x13', 'x14', 'x15', 'x16', 'x17', 'x18', 'x19', 'x3', 'y']
data.columns = Cnames
def crossReport(flag):
    print("《=========",flag," and y=============")
    cross_data = pd.qcut(data[flag], [0, 0.25, 0.5, 0.75, 1])
    cross = pd.crosstab(cross_data, data['y'])
    print(flag, " 和 y 的交叉报表:\n", cross)
    cross.plot(kind='bar')
    plt.show()
    print("=========end=============》")
if __name__ == "__main__":
    flagList = ['x6','x7','x12','x13']
    for flag in flagList:
        crossReport(flag)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值