【笔记】（集成学习）多个模型融合以提升效果（准确率）的方法：Bagging框架（随机森林）；Boosting框架（Adaboost，GBDT，XGBOOST）；Stacking框架

最新推荐文章于 2023-10-18 22:48:19 发布

程序猿的探索之路

最新推荐文章于 2023-10-18 22:48:19 发布

阅读量487

点赞数

分类专栏：小菜鸡加油文章标签： python pytorch 人工智能

原文链接：https://blog.csdn.net/Mr_tyting/article/details/72957853

版权

小菜鸡加油专栏收录该内容

396 篇文章 30 订阅

订阅专栏

#coidng:utf-8
import pandas as pd
import numpy as np
from sklearn.model_selection import KFold

train=pd.read_csv("train.csv")
test=pd.read_csv("test.csv")

ntrain=train.shape[0] ## 891
ntest=test.shape[0]   ## 418
kf=KFold(n_splits=5,random_state=2017)

def get_oof(clf,x_train,y_train,x_test):
    oof_train=np.zeros((ntrain,))  ##shape为(ntrain,)表示只有一维 891*1
    oof_test=np.zeros((ntest,))    ## 418*1
    oof_test_skf=np.empty((5,ntest))  ## 5*418
    for i,(train_index,test_index) in enumerate(kf.split(x_train)):
        kf_x_train=x_train[train_index] ## (891/5 *4)*7 故shape：(712*7)
        kf_y_train=y_train[train_index] ## 712*1
        kf_x_test=x_train[test_index]   ## 179*7

        clf.train(kf_x_train,kf_y_train)

        oof_train[test_index]=clf.predict(kf_x_test)
        oof_test_skf[i,:]=clf.predict(x_test)

    oof_test[:]=oof_test_skf.mean(axis=0)
    return oof_train.reshape(-1,1),oof_test.reshape(-1,1)

程序猿的探索之路

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【笔记】（集成学习）多个模型融合以提升效果（准确率）的方法：Bagging框架（随机森林）；Boosting框架（Adaboost，GBDT，XGBOOST）；Stacking框架

#coidng:utf-8import pandas as pdimport numpy as npfrom sklearn.model_selection import KFoldtrain=pd.read_csv("train.csv")test=pd.read_csv("test.csv")ntrain=train.shape[0] ## 891ntest=test.shape[0] ## 418kf=KFold(n_splits=5,...
复制链接

扫一扫

专栏目录