《模型融合》投票法、stacking和blending

最新推荐文章于 2023-12-07 20:31:50 发布

我叫陈叉叉叉叉

最新推荐文章于 2023-12-07 20:31:50 发布

阅读量675

点赞数 1

分类专栏：机器学习鸭

本文链接：https://blog.csdn.net/wwqnmdhmp/article/details/108838404

版权

机器学习鸭专栏收录该内容

12 篇文章 4 订阅

订阅专栏

import numpy as np 
import pandas as pd
import matplotlib.pyplot as plt 
import seaborn as sns
%matplotlib inline
plt.rcParams["font.sans-serif"] = ["FangSong"] 
plt.rcParams["axes.unicode_minus"] = False 
import warnings
warnings.filterwarnings("ignore")

from sklearn.svm import SVC
from sklearn.linear_model import LogisticRegression
from sklearn.ensemble import RandomForestClassifier, VotingClassifier
from sklearn.datasets import load_breast_cancer
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score,mean_squared_error
import lightgbm

clf1 = LogisticRegression(random_state=0)
clf2 = RandomForestClassifier(random_state=0)
clf3 = SVC(random_state=0,probability=True)
clf4 = lightgbm.LGBMClassifier(random_state=0)

data = load_breast_cancer()

X,y = data.data,data.target

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2 ,random_state=2020)

for model in ['clf1','clf2','clf3','clf4']:
    model = eval(model)
    model.fit(X_train,y_train)
    pre = model.predict_proba(X_test)
    print(model)
    print(mean_squared_error(model .predict(X_test),y_test))

LogisticRegression(random_state=0)
0.02631578947368421
RandomForestClassifier(random_state=0)
0.03508771929824561
SVC(probability=True, random_state=0)
0.08771929824561403
LGBMClassifier(random_state=0)
0.03508771929824561

投票法

VotingClassifier?

vclf = VotingClassifier(estimators=[('lr', clf1), ('rf', clf2), ('svc', clf3),('lgb',clf4)],voting='soft')
vclf = vclf .fit(X_train,y_train)

mean_squared_error(vclf .predict_proba(X_test)[:,1],y_test)

0.025698284205186814

vclf = VotingClassifier(estimators=[('lr', clf1), ('rf', clf2), ('svc', clf3),('lgb',clf4)], voting='soft', weights=[3, 1, 1,2])
vclf = vclf .fit(X_train,y_train)
print(vclf .predict_proba(X_test))

mean_squared_error(vclf .predict_proba(X_test)[:,1],y_test)

0.021581896019948466

stacking

from mlxtend.classifier import StackingClassifier
from sklearn.linear_model import LinearRegression
lr = LinearRegression()

sclf = StackingClassifier(classifiers=[clf2, clf3, clf4], 
                          meta_classifier=lr)

sclf.fit(X_train,y_train)
mean_squared_error(vclf .predict_proba(X_test)[:,1],y_test)

0.021581896019948466

blending

new_test = []
new_train = []
for model in ['clf1','clf2','clf3','clf4']:
    model = eval(model)
    model.fit(X_train,y_train)
    pre_test = model.predict_proba(X_test)
    pre_train =  model.predict_proba(X_train)
    new_test.append(pre_test[:,1])
    new_train.append(pre_train[:,1])

lr.fit(np.array(new_train).T,y_train)

LinearRegression()

mean_squared_error(lr.predict(np.array(new_test).T),y_test)

0.024812030295457036

我叫陈叉叉叉叉

关注

1
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
《模型融合》投票法、stacking和blending

import numpy as np import pandas as pdimport matplotlib.pyplot as plt import seaborn as sns%matplotlib inlineplt.rcParams["font.sans-serif"] = ["FangSong"] plt.rcParams["axes.unicode_minus"] = False import warningswarnings.filterwarnings("ignore")
复制链接

扫一扫

专栏目录