目录
(注:每一章节可以为一个py文件,4、5、6、7写在同一个文件中,最好用jupyter notebook)
1. 获取数据集
下面两种方式:UCI、Kaggle
得到的csv文件为:
2. 数据集介绍
数据集有1025行,14列。每行表示一个病人。13列表示特征,1列表示标签(是否患心脏病)
| age | 年龄 |
| sex | 性别,1表示男,0表示女 |
| cp | 心绞痛病史,1:典型心绞痛,2:非典型心绞痛,3:无心绞痛,4:无症状 |
| trestbps | 静息血压,入院时测量得到,单位为毫米汞柱(mm Hg) |
| chol | 胆固醇含量,单位:mgldl |
| fbs | 空腹时是否血糖高,如果空腹血糖大于120 mg/dl,值为1,否则值为0 |
| restecg | 静息时的心电图特征。0:正常。1: ST-T波有异常。2:根据Estes准则,有潜在的左 |
| thalach | 最大心率 |
| exang | 运动是否会导致心绞痛,1表示会,0表示不会 |
| oldpeak | 运动相比于静息状态,心电图中的ST-T波是否会被压平。1表示会,0表示不会 |
| slope | 心电图中ST波峰值的坡度(1:上升,2:平坦,3:下降) |
| ca | 心脏周边大血管的个数(0-3)