stacking多模型融合+交叉验证对鸢尾花数据集进行分类

最新推荐文章于 2024-06-14 18:02:34 发布

赴前尘

最新推荐文章于 2024-06-14 18:02:34 发布

阅读量4.4k

点赞数 6

分类专栏：数据挖掘文章标签： stacking 多模型融合交叉验证

本文链接：https://blog.csdn.net/qq_36940806/article/details/100104155

版权

该博客展示了如何利用stacking技术结合随机森林、决策树和K近邻等多个模型，通过5折交叉验证对鸢尾花数据集进行分类。在交叉验证过程中，各模型在不同折的准确率表现稳定，最终得出的测试准确率为0.9667。

摘要由CSDN通过智能技术生成

stacking技术图示：

完整代码：

# -*- coding: utf-8 -*-

from sklearn.datasets import load_iris
import numpy as np
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score
from sklearn.model_selection import StratifiedKFold, train_test_split
import pandas as pd

# 显示所有列
from sklearn.neighbors import KNeighborsClassifier
from sklearn.tree import DecisionTreeClassifier

import lightgbm as lgb

pd.set_option('display.max_columns', None)
# 显示所有行
pd.set_option('display.max_rows', None)
# 设置value的显示长度为100，默认为50
pd.set_option('max_colwidth', 100)


def stacking(model, train_data, train_target, test_data, n_fold):
    """
    :param model:  模型算法
    :param train_data:  训练集(不含带预测的目标特征)
    :param train_target:  需要预测的目标特征
    :param test_data:   测试集
    :param n_fold:   交叉验证的折数
    :return:
    """
    skf = StratifiedKFold(n_splits=n_fold, random_state=1)  # StratifiedKFold 默认分层采样
    train_pred = np.zeros((train_data.shape[0], 1), int)   # 存储训练集预测结果
    test_pred = np.zeros((test_data.shape[0], 1), int)  # 存储测试集预测结果 行数：len(test_data) ,列数：1列
    for skf_index, (train_index, val_index) in enumerate(skf.split(train_data, train_target)):
        print('第 ', skf_index+1, ' 折交叉验证开始... ')
        # 训练集划分
        x_train, x_val = train_data.iloc[train_index], train_da

最低0.47元/天解锁文章

赴前尘

关注

6
点赞
踩
77

收藏

觉得还不错? 一键收藏
打赏
17
评论
stacking多模型融合+交叉验证对鸢尾花数据集进行分类

stacking技术图示：完整代码：# -*- coding: utf-8 -*-from sklearn.datasets import load_irisimport numpy as npfrom sklearn.ensemble import RandomForestClassifierfrom sklearn.metrics import accuracy_sco...
复制链接

扫一扫