实战五：基于Pima印第安人数据——Model_ensemble-example

超级圈

于 2019-06-30 11:12:38 发布

阅读量1.5k

点赞数

分类专栏：机器学习算法与实战

本文链接：https://blog.csdn.net/weixin_44953364/article/details/94213097

版权

本文通过Pima印第安人数据集进行糖尿病预测，探讨了三种模型融合方法：投票器模型融合、Bagging、RandomForest和Adaboost。数据包括怀孕次数、葡萄糖、血压等特征，最终目标是预测类标变量（0或1）。

摘要由CSDN通过智能技术生成

数据读取

import pandas as pd  # 数据科学计算工具

data = "pima-indians-diabetes.data.csv"
#年纪、怀孕、血液检查的次数... 匹马印第安人糖尿病的数据集
names = ['preg', 'plas', 'pres', 'skin', 'test', 'mass', 'pedi', 'age', 'class']
df = pd.read_csv(data, names=names)

【0】Pregnancies：怀孕次数
【1】Glucose：葡萄糖
【2】BloodPressure：血压 (mm Hg)
【3】SkinThickness：皮层厚度 (mm)
【4】Insulin：胰岛素 2小时血清胰岛素（mu U / ml
【5】BMI：体重指数（体重/身高）^2
【6】DiabetesPedigreeFunction：糖尿病谱系功能
【7】Age：年龄（岁）
【8】Outcome：类标变量（0或1）