心脏病发作分析与预测数据集(Heart Attack Analysis & Prediction Dataset)

166 篇文章 31 订阅

原文:

About this dataset

  • Age : Age of the patient

  • Sex : Sex of the patient

  • exang: exercise induced angina (1 = yes; 0 = no)

  • ca: number of major vessels (0-3)

  • cp : Chest Pain type chest pain type

    • Value 1: typical angina

    • Value 2: atypical angina

    • Value 3: non-anginal pain

    • Value 4: asymptomatic

  • trtbps : resting blood pressure (in mm Hg)

  • chol : cholestoral in mg/dl fetched via BMI sensor

  • fbs : (fasting blood sugar > 120 mg/dl) (1 = true; 0 = false)

  • rest_ecg : resting electrocardiographic results

    • Value 0: normal

    • Value 1: having ST-T wave abnormality (T wave inversions and/or ST elevation or depression of > 0.05 mV)

    • Value 2: showing probable or definite left ventricular hypertrophy by Estes' criteria

  • thalach : maximum heart rate achieved

  • target : 0= less chance of heart attack 1= more chance of heart attack

译文:

关于此数据集

年龄:患者的年龄

性别:患者的性别

例:运动性心绞痛(1=yes;0=否)

ca:主要船舶数量(0-3)

cp:胸痛型胸痛型

值1:典型心绞痛

值2:非典型心绞痛

值3:非心绞痛

值4:无症状

trtbps:静息血压(单位:毫米汞柱)

chol:通过BMI传感器获取的胆固醇(mg/dl)

fbs:(空腹血糖>120毫克/分升)(1=真;0=假)

静息心电图:静息心电图结果

值0:正常

值1:ST-T波异常(T波倒置和/或ST段抬高或压低>0.05 mV)

值2:根据Estes标准显示可能或确定的左心室肥大

thalach:达到最大心率

目标:0=心脏病发作的几率减少1=心脏病发作的几率增加

大家可以到官网地址下载数据集,我自己也在百度网盘分享了一份。可关注本人公众号,回复“2021071401”获取下载链接。

  • 1
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
Kaggle的Heart Attack Analysis & Prediction Dataset数据集可以进行很多统计推断,比如假设检验、置信区间估计等。下面以假设检验为例,给出详细的代码实现步骤。 我们可以使用t检验来比较两组样本的均值是否有显著差异。例如,我们可以比较男女两组样本的胆固醇平均值是否有显著差异,具体实现步骤如下: ``` python # 导入必要的库和数据集 import pandas as pd from scipy.stats import ttest_ind data = pd.read_csv('heart.csv') # 分离男女两组样本 male_cholesterol = data[data['sex'] == 1]['chol'] female_cholesterol = data[data['sex'] == 0]['chol'] # 计算两组样本的均值和标准差 male_mean = male_cholesterol.mean() male_std = male_cholesterol.std() female_mean = female_cholesterol.mean() female_std = female_cholesterol.std() print('男性样本的胆固醇平均值:', round(male_mean, 2), '标准差:', round(male_std, 2)) print('女性样本的胆固醇平均值:', round(female_mean, 2), '标准差:', round(female_std, 2)) # 进行假设检验 t_statistic, p_value = ttest_ind(male_cholesterol, female_cholesterol, equal_var=False) print('t值:', round(t_statistic, 2)) print('p值:', round(p_value, 4)) ``` 上述代码中,我们首先使用pandas库读入数据集heart.csv,并使用sex特征将样本分为男性和女性两组。然后,我们计算了两组样本的胆固醇平均值和标准差,并使用ttest_ind()函数进行假设检验。该函数返回t值和p值,其中t值用于衡量两组样本均值的差异,p值用于判断差异是否显著。在该示例中,我们使用equal_var=False指定了两组样本的方差不相等。最后,我们输出了t值和p值的结果。如果p值小于显著性水平(通常为0.05),则可以拒绝原假设,即认为两组样本的均值有显著差异。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

不务正业的猿

谢谢您的支持与鼓励!!!

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值