基于机器学习的心脏病预测方法（3）——数据预处理及评价指标介绍

wendy_ya

已于 2023-02-14 16:33:32 修改

阅读量3.4k

点赞数 1

分类专栏：基于机器学习的心脏病预测方法 python 文章标签：深度学习算法

于 2021-09-09 16:32:28 首次发布

本文链接：https://blog.csdn.net/didi_ya/article/details/120203834

版权

基于机器学习的心脏病预测方法同时被 2 个专栏收录

14 篇文章 32 订阅 ¥99.90 ¥299.90

订阅专栏

超级会员免费看

python

103 篇文章 21 订阅

订阅专栏

本文介绍了基于机器学习的心脏病预测，包括数据预处理中训练集和测试集的划分，以及评价指标如TP/TN/FP/FN、混淆矩阵、准确率、精准率、召回率、F分数和ROC曲线与AUC的详细解释。

摘要由CSDN通过智能技术生成

一、数据预处理

1.1 训练集和测试集的划分

从303份数据中随机抽取80%作为训练集，20%作为测试集。即242份进行训练，61份进行测试。

from sklearn.model_selection import train_test_split

predictors = data.drop("target",axis=1)
target = data["target"]

X_train,X_test,Y_train,Y_test = train_test_split(predictors,target,test_size=0.20,random_state=0)
print("Training features have {0} records and Testing features have {1} records.".\
      format(X_train.shape[0], X_test.shape[0]))