机器学习项目---预测心脏病(一)

本文介绍了使用机器学习预测心脏病的项目,探讨了问题定义、关键特征以及数据加载过程。通过探索性数据分析(EDA),发现如年龄、性别、胸痛类型、静息血压、胆固醇水平等因素对预测心脏病有显著影响。通过对不同特征的分析,揭示了与心脏病患病风险相关的重要指标。
摘要由CSDN通过智能技术生成

使用机器学习预测心脏病

问题定义

给定有关患者的临床参数,我们能否预测他们是否患有心脏病,
查看您是否可以在心脏数据中找到其他趋势来预测某些心血管事件或找到心脏健康的任何明确迹象

特征

#导入相关的库
mport pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import numpy as np

%matplotlib inline
sns.set_style("whitegrid")
plt.style.use("fivethirtyeight")

加载数据

df = pd.read_csv("./data/heart.csv")
df.head()

在这里插入图片描述
1、age - age in years
2、sex -(1 =男性; 0 =女性)
3、cp - -胸痛类型(0: 典型的心绞痛:与胸痛有关,减少心脏的血液供应1: 非心绞痛:通常为食道痉挛(与心脏无关)2: 非心绞痛:通常为食道痉挛(与心脏无关)3: 无症状:胸痛未显示疾病迹象)
4、trestbps - 静息血压(入院时以毫米汞柱为单位)高于130-140的情况通常令人担忧
5、chol - 血清胆汁,mg / dl
血清= LDL + HDL + 0.2 *甘油三酸酯
200以上值得关注
6、fbs-(空腹血糖> 120 mg / dl)(1 =正确; 0 =错误)
'> 126’mg / dL表示糖尿病
7、restecg --静息心电图结果
0:没什么可注意的
1:ST-T波异常
范围从轻度症状到严重问题
表示心跳不正常
2:可能或确定的左心室肥大
扩大心脏的主泵室
8、丘脑-达到最大心率
9、exang - 运动诱发的心绞痛(1 =是; 0 =否)
10、oldpeak - 运动引起的相对于休息的ST抑郁会在运动不健康的心脏时观察心脏的压力,这会增加压力
11、slope - 最高运动ST段的坡度
0: Upsloping: 锻炼可提高心率(罕见)
1: Flatsloping: 变化很小(典型的健康心脏)
2: Downslopins:心脏不健康的体征
12、ca - 萤光显色的主要血管数目(0-3)
彩色血管意味着医生可以看到血液通过
血液运动越多越好(无凝块)
13、thal - al-lium应力结果
1,3:正常
6: 修复缺陷:曾经是缺陷,但是现在可以了
7: 可逆缺陷:锻炼时没有适当的血液运动
14、target - 是否患有疾病(1 =是,0 =否)(=预测属性)

df.info()

在这里插入图片描述

pd.set_option("display.float","{:.2f}".format)
df.target.value_counts()
df.target.value_counts().plot(kind="bar", color=["salmon", "lightblue"])

在这里插入图片描述

探索性数据分析(EDA)

这里的目标是查找有关数据的更多信息,并成为您正在使用的数据集上的主题导出。
您要解决什么问题?
我们拥有什么样的数据,以及如何处理不同类型的数据?
数据中缺少什么以及如何处理?
异常值在哪里,为什么要关心它们?
您如何添加,更改或删除功能以从数据中获取更多信息

  • 9
    点赞
  • 90
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值