UCI——心脏病数据集分析报告

最新推荐文章于 2025-02-24 13:09:17 发布

山外小楼听夜雨.

最新推荐文章于 2025-02-24 13:09:17 发布

阅读量6.9k

点赞数 2

分类专栏：研1课程学习文章标签： python

本文链接：https://blog.csdn.net/weixin_42521185/article/details/122178830

版权

文章目录

1 前期准备
2 对于数据集进行导入、查看及简单分析
- 2.1 代码及注释
- 2.2 简单分析属性的相关系数关系

写在前面：研一的机器学习课程需要针对UCI的一个数据集进行分析。所以就有了这篇文章。也是第一次好好学习机器学习了。

[P5]

1 前期准备

本次实验基于spyder，python3.7，数据集 heart.csv

1.1 安装数据分析+可视化第三方工具包

首先打开anaconda prompt，然后输入下面一行代码即可。

pip install numpy pandas matplotlib seaborn wheel pandas_profiling jupyter notebook -i https://pypi.tuna.tsinghua.edu.cn/simple

介绍一下每一个库

Numpy：是python语言的一个扩展程序库；支持大量的维度数组与矩阵运算，此外也针对数组运算提供大量的数学函数库。
pandas

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

山外小楼听夜雨.

关注关注

2
点赞
踩
22

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

基于机器学习的心脏病预测方法（1）——心脏病及Heart Disease UCI数据集和Kaggle数据集介绍

Wendy的博客

09-09

2万+

疾病预测研究方法，必须要在实践中检验才能更符合实际的应用。目前，预测疾病的模型很多，但是对于特定的疾病，不同的模型结构和参数选择，对预测结果的影响非常大。此外，疾病本身是一个非常复杂的现象，通常受到环境、个人、社会等多种因素的影响。对于不同的疾病，如何找到与疾病本身相适应的预测模型和方法，从而高效准确的预测发病趋势，提高诊断精度，是目前需要解决的一个问题。（１）年龄：作为影响心血管疾病发病因素，有研究报告指出，患有心血管疾病的人数大多为48至50岁，并且年纪越大的群体患心血管疾病种类更多。（２）性别。

Heart Disease UCI（心脏病相关数据集）

不务正业的猿

10-15

6812

原文： This database contains 76 attributes, but all published experiments refer to using a subset of 14 of them. In particular, the Cleveland database is the only one that has been used by ML researchers to this date. The "goal" field refers to the presenc

参与评论您还未登录，请先登录后发表或查看评论

UCI 心脏病数据集heart-disease

06-17

The file cleveland.data has been unfortunately messed up when we lost node cip2 and loaded the file on node ics. The file processed.cleveland.data seems to be in good shape and is useable (for the 14 attributes situation). I'll clean up cleveland.data as soon as possible. Bad news: my original copy of the database appears to be corrupted. I'll have to go back to the donor to get a new copy. David Aha

数据分析案例-青少年心脏病发作数据集可视化分析

热门推荐

m0_51732188的博客

04-25

2万+

在UCI机器学习库中，Heart Disease Data Set一共包含4个关于心脏病诊断的数据库。其中数据分别来源自： Cleveland Clinic Foundation (cleveland.data) Hungarian Institute of Cardiology, Budapest (hungarian.data) V.A. Medical Center, Long Beach, CA (long-beach-va.data) University Hospital, Zurich,

判别分析——基于心脏病数据集实现

所念皆星河

11-26

434

UCI 心脏病数据集是一个著名的数据集，用于心脏病的分析和预测。它包含各种医学测量和患者信息。目标是根据这些属性预测患者是否患有心脏病。本实验针对五个特征：sbp，tobacco，IDI，adiposity，age五个属性，判别病人是否患有心脏病。 UCI 心脏病数据集包含从四个不同地点收集的数据：克利夫兰、匈牙利、瑞士和 VA 长滩。目标是根据各种医学属性预测患者是否患有心脏病。

UCI Heart Disease Data Set—— UCI 心脏病数据集介绍

所念皆星河

11-22

653

UCI 心脏病数据集是一个著名的数据集，常用于机器学习和统计分析，特别是在预测心脏病方面。UCI 心脏病数据集包含从四个不同地点收集的数据：克利夫兰、匈牙利、瑞士和 VA 长滩。目标是根据各种医学属性预测患者是否患有心脏病。

数据分析实战：利用python对心脏病数据集进行分析

01-06

↑ 关注 + 星标 ~ 有趣的不像个技术号每晚九点，我们准时相约我们都很害怕生病，但感冒发烧这种从小到大的疾病我们已经麻木了，因为一星期他就会好，但是随着长大，各种发炎、三高、心脏病、冠心病响应而生。 心脏病作为一种发作起来让人看了就觉得恐怖的疾病，每年不知道夺走多少生命。而那些患病健在的人们也必须在自己后续的生命里割舍太多东西，以防止心脏病发作。没有得病的时候，我们永远觉得它离自己很远。我对心脏病的认知就是这样，我不知道它患病的原因，也不知哪些原因会引起心脏病。而患病后如何保持正常生活等等，一概不知。今天在kaggle上看到一个心脏病数据（数据集下载地址和源码见文末），那么借此

心脏病数据集（入门级）

Yujiangz的博客

06-30

3467

心脏病数据集（入门级）：数据导入、数据清洗、数据可视化、数据分析

Heart Disease Dataset心脏病数据集-数据集

03-11

Heart Disease Dataset is provided by Hungarian Institute of Cardiology,University Hospital, Zurich,University Hospital, Basel and Long Beach and Cleveland Clinic Foundation.本数据集由匈牙利心脏病研究所，瑞士苏黎世大学医院，瑞士巴塞尔大学医院和长滩和克里夫兰临床基金会提供。 heart-disease.cost heartdisease.delay heartdisease.expense heart-disease.group heart-disease.names heartdisease_ask-detrano heartdisease_ask-detrano (2) heartdisease_processed.cleveland.data heartdisease_cleve.mod heartdisease_cleveland.data heartdisease_long-beach-va.data heartdisease_new.data heartdisease_processed.hungarian.data heartdisease_processed.switzerland .data heartdisease_processed.va.data heartdisease_switzerland.data heartdisease_hungarian.data

heart_disease_prediction:心脏病UCI数据集

04-01

heart_disease_prediction 心脏病UCI数据集 该实验只是根据心脏病的缺席情况简单地预测心脏病的存在。 1.关于数据集：该数据集在Kaggle（）上提供。并且可以从UCI机器学习存储库（）中获得。数据包含总共14个属性，如下所示。属性说明年龄：岁性别：性别（1 =男性； 0 =女性） cp：胸痛类型值1：典型心绞痛值2：非典型心绞痛值3：非心绞痛2值：无症状 trestbps：静息血压（入院时以毫米汞柱为单位）胆汁：血清胆汁，mg / dl fbs ：（空腹血糖> 120 mg / dl）（1 =正确； 0 =错误） restecg：静息心电图结果值0：正常值1：ST-T波异常（T波倒置和/或ST升高或降低> 0.05 mV）值2：按照Estes的标准显示可能或确定的左心室肥大丘脑：达到最大心率 exang：运动引起的心绞痛（

心脏疾病数据集

03-03

心脏疾病数据集

心脏病数据集（1190 个实例和 11 个特征）【500010103】

04-25

该心脏病数据集是通过组合 5 个已经独立可用但以前未合并的流行心脏病数据集来策划的。在这个数据集中，5 个心脏数据集结合了 11 个共同特征，使其成为迄今为止可用于研究目的的最大心脏病数据集。该数据集由 1190 个实例和 11 个特征组成。这些数据集被收集并组合在一个地方，以帮助推进与CAD相关的机器学习和数据挖掘算法的研究，并希望最终推进临床诊断和早期治疗。

心脏病数据集（30万条，表格数据）

06-19

心脏病数据集（30万条，表格数据），经过数据清洗。数据格式：Excel表格包括的属性信息：HeartDisease BMI Smoking AlcoholDrinking Stroke PhysicalHealth MentalHealth DiffWalking Sex AgeCategory

炮炮寻找数据集的坎坷之路2——UCI数据集Heart Disease

weixin_48137421的博客

07-22

1609

基于CNN、RNN、LSTM等深度学习模型来预测心血管疾病

玩转UCI心脏病二分类数据集 领学课笔记

“逛丢一只鞋”的博客

07-15

4818

通过一系列数据的挖掘来判断病人有没有心脏病。

基于Kaggle心脏病数据集的数据分析和分类预测-StatisticalLearning统计学习实验报告

qq_40605313的博客

09-02

2万+

基于Kaggle心脏病数据集的数据分析和分类预测-StatisticalLearning统计学习实验报告一、实验准备本数据来源于kaggle,包含14个维度，303个样本，具体的变量说明如下表所示。变量名详细说明取值范围 target 是否患有心脏病（分类变量） 0=否，1=是 age 年龄（连续变量） [29，77] sex 性别（分类变量） 1=男，0=女 cp 胸痛经历（分类变量） 1=典型心绞痛，2=非典型性心绞痛，3=非心绞痛，4=无症状 trestbps