kaggle数据分析项目--heart disease(2)

本文探讨了Kaggle heart disease数据集的分析,通过带密度图的直方图和箱线图展示数据分布。直方图显示静息血压在不同血管状况下分布相似,箱线图揭示静息血压、血清胆固醇与心率与血管癌变的关系,同时指出性别差异。对图用于展现不同变量间的关联,强调选择熟悉领域的数据分析重要性。
摘要由CSDN通过智能技术生成

上一篇文章主要是用直方图以及饼图简单看了一下数据的情况,这一篇主要关于带密度图的直方图和箱线图。还是一样针对kaggle项目的heart disease数据而言。
1、带密度图的直方图
上一篇我有提到distplot函数可以画带密度的直方图,但是我昨天画的时候发现效果图很矮,今天发现问题所在:问题是因为我在distplot函数里添加了分类数据hue,所以去掉这个参数即可。直接看效果图。
在这里插入图片描述x轴为静息血压。可以发现在不同血管发生癌变的病人中,静息血压大体分布一致,除了ca=4的时候,出现这种情况我是认为是数据样本少的原因。

代码如下:
#因为我是对多个指标做直方图,所以就用了for循坏
index1=[‘trestbps’,‘chol’,‘thalach’]
for i in range(0,3):
g4=sns.FacetGrid(heart,col=‘ca’)
g4.map(sns.distplot,index1[i])#不要添加分类变量hue,否则效果图不好
g4.add_legend()
plt.show()

2、箱线图
想要看数据的整体分布情况,除了用密度图之外,还可以用箱线图,而且箱线图比带密度的直方图好的地方在于可以添加hue变量。直接上图。
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值