集成学习之VotingClassifier

最新推荐文章于 2024-07-30 18:41:07 发布

ahhhaaaaaaaaa

最新推荐文章于 2024-07-30 18:41:07 发布

阅读量1k

点赞数

文章标签：机器学习数据挖掘 python

本文链接：https://blog.csdn.net/eagle0116/article/details/106463468

版权

直接看代码

from sklearn.ensemble import RandomForestClassifier
from sklearn.ensemble import VotingClassifier
from sklearn.linear_model import LogisticRegression
from sklearn.svm import SVC
from sklearn.datasets import load_iris
from sklearn.metrics import accuracy_score
from sklearn.model_selection import train_test_split

import pandas as pd
import warnings
warnings.filterwarnings('ignore')
date = pd.read_csv('datingTestSet.txt', sep='\t')

X = date.iloc[:,:-1]
y = date.iloc[:,-1]

trainx, testx, trainy, testy = train_test_split(X, y, test_size=0.25, random_state=1)

log = LogisticRegression()
rnd = RandomForestClassifier()
svm = SVC()
voting = VotingClassifier(estimators=[('lr',log), ('rf',rnd), ('svm',svm)],voting='hard')

for clf in (log, rnd, svm, voting):
    clf.fit(trainx, trainy)
    y_ = clf.predict(testx)
    print(clf.__class__.__name__, accuracy_score(y_, testy))

运行结果：

LogisticRegression 0.868
RandomForestClassifier 0.972
SVC 0.808
VotingClassifier 0.952

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

ahhhaaaaaaaaa

关注关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

集成学习VotingClassifier、HistGradientBoostingClassifier、Stacking、Blending

data+scenario+science+insight

06-05

624

集成学习VotingClassifier、HistGradientBoostingClassifier、Stacking、Blending 目录 集成学习VotingClassifier、HistGradientBoostingClassifier、Stacking、Blending VotingClassifier HistGradientBoostingClassifier Stacking Blending VotingClassifier VotingClassifier可能是思想最

matlab 集成学习,集成学习

weixin_30290131的博客

03-19

1525

假设你去随机问很多人一个很复杂的问题，然后把它们的答案合并起来。通常情况下你会发现这个合并的答案比一个专家的答案要好。这就叫做群体智慧。同样的，如果你合并了一组分类器的预测(像分类或者回归)，你也会得到一个比单一分类器更好的预测结果。这一组分类器就叫做集成；因此，这个技术就叫做集成学习，一个集成学习算法就叫做集成方法。例如，你可以训练一组决策树分类器，每一个都在一个随机的训练集上。为了去做预测，你...

1 条评论您还未登录，请先登录后发表或查看评论

03-31

09-17

藓类少女的博客

07-30

614

VotingClassifier 是一个用于集成学习的分类器，它结合了多个不同模型的预测结果，以提高整体的预测准确性和稳定性。集成学习的基本思想是通过结合多个弱分类器来创建一个强分类器。VotingClassifier 是 scikit-learn 库中的一个类，支持多种分类模型的集成。

机器学习报告-基于PCA和KNN算法的毒蘑菇分类预测实验报告-机器学习高分大作业

11-18

机器学习报告-机器学习大作业16页-基于PCA和KNN算法的毒蘑菇分类预测-1.研究意义2.数据描述3.模型描述4.算法实现5.运行结果及意义说明6.总结(原创资源,作者的机器学习课程报告)

毒蘑菇数据集的分类及评估

weixin_43333607的博客

06-27

4029

对于朴素贝叶斯算法，准确率为93.3%，召回率为88.3%，从准确率及召回率值来看，朴素贝叶斯分类算法可以用于预测，但与决策树及KNN算法相比，朴素贝叶斯算法的预测能力还是不够的。由于分析对象是蘑菇是否有毒，对于食用物来说我们要提高召回率即查全率，相比三种模型，决策树和KNN都将准确率和召回率达到最大值，可很有说服力的作为预测模型，相比较而言朴素贝叶斯召回率只有88.3%，由于有更好的预测模型，因此可以忽略朴素贝叶斯方法。a) 查看数据行列情况，判断是否有空行，进行删除；决策树效果：（未解决中文乱码问题）

对两种类型的蘑菇图像进行识别与分类——使用SVM分类器（matlab）

weixin_43808138的博客

02-21

4978

使用SVM线性分类器（二分法）对两种类型的蘑菇进行分类与识别（预测） SVM的建模与调用

机器学习之集成学习理论与代码实践

06-14

在"机器学习之集成学习理论与代码实践"中，读者可以期待通过实例了解如何实现这些方法。例如，使用Python的scikit-learn库，我们可以轻松构建集成模型。从VotingClassifier和VotingRegressor到BaggingClassifier和...

机器学习之集成学习和随机森林

01-20

在机器学习领域，集成学习是一种强大的技术，它通过组合多个弱学习器来创建一个更强大、更稳定的强学习器。这种技术的核心思想是利用多样性来提高整体性能，因为不同的学习器可能会在不同的数据子集上表现得更好。...

学习笔记 - SVM&集成学习

Hide on Bush

10-18

992

10.18

机器学习毒蘑菇预测数据集

11-22

数据集描述https://archive.ics.uci.edu/ml/datasets/mushroom 一共22个特征，第一列为标签，是否有毒。

蘑菇数据集

05-19

蘑菇数据集

TDT4300-Assignment-4-Decision-Tree:使用决策树分类器对有毒蘑菇进行分类

04-09

TDT4300-分配4-决策树使用决策树和K近邻分类器对有毒蘑菇进行分类。

xgboost 毒蘑菇mushroom数据集分类

小草的博客

06-15

7977

安装 xgboost pip3 install xgboost 毒蘑菇数据集毒蘑菇数据集的描述参考： https://archive.ics.uci.edu/ml/datasets/Mushroom 毒蘑菇的特征描述如下 Attribute Information: 1. cap-shape: bell=b,conical=c,convex=x,flat=f, knobbed=k,sunken...

ML之LoR&DT&RF：基于LoR&DT(CART)&RF算法对mushrooms蘑菇数据集(22+1,6513+1611)训练来预测蘑菇是否毒性(二分类预测)

近期请国内外头部出版社可尽快私信博主！——心比天高，仗剑走天涯，保持热爱，奔赴向梦想！低调，谦虚，自律，反思，成长，还算是比较正能量的博主，公益免费传播……内心特别想在AI界做出一些可以推进历史进程影响力的东西(兴趣使然，有点小情怀，也有点使命感呀)…

05-29

1万+

ML之LoR&DT&RF：基于LoR&DT(CART)&RF算法对mushrooms蘑菇数据集(22+1,6513+1611)训练来预测蘑菇是否毒性(二分类预测) 目录输出结果设计思路核心代码输出结果 0、数据集 after LabelEncoder 1、LoR算法 LoR_mo...

练习——随机森林分类毒、可食用蘑菇数据集

热门推荐

我是托蜜的博客

04-12

1万+

假如我们在山上采蘑菇，为了避免食物中毒，需要采集那些有较大的置信度认为可食用的蘑菇，虽然这种办法会遗漏掉许多我们难以判断的蘑菇（实际是可食用的）。对此，我们希望能找到那种能很好区分的特征，或者说区分度很大的特征，来避免危险，保证安全，所以我采用随机森林算法来实现目的。毒蘑菇数据集是一个包含8123个样本的数据集，有22个特征，为菌盖颜色、菌盖形状、菌盖表面形状、气味、菌褶等，下图是网上找的示意...

集成学习模型代码python

03-01

集成学习是一种通过组合多个基本模型来提高预测准确性的机器学习方法。下面是一个使用Python实现集成学习模型的示例代码： ```python # 导入所需的库 from sklearn.ensemble import VotingClassifier from sklearn.tree import DecisionTreeClassifier from sklearn.neighbors import KNeighborsClassifier from sklearn.svm import SVC from sklearn.datasets import load_iris from sklearn.model_selection import train_test_split from sklearn.metrics import accuracy_score # 加载数据集 iris = load_iris() X, y = iris.data, iris.target # 划分训练集和测试集 X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42) # 定义基本模型 model1 = DecisionTreeClassifier() model2 = KNeighborsClassifier() model3 = SVC() # 定义集成学习模型 ensemble_model = VotingClassifier(estimators=[('dt', model1), ('knn', model2), ('svm', model3)], voting='hard') # 训练集成学习模型 ensemble_model.fit(X_train, y_train) # 在测试集上进行预测 y_pred = ensemble_model.predict(X_test) # 计算准确率 accuracy = accuracy_score(y_test, y_pred) print("准确率：", accuracy) ``` 在上面的代码中，我们使用了三个基本模型：决策树分类器（DecisionTreeClassifier）、K近邻分类器（KNeighborsClassifier）和支持向量机分类器（SVC）。然后，我们使用VotingClassifier来定义集成学习模型，其中estimators参数指定了基本模型的名称和实例，voting参数指定了投票策略（'hard'表示多数表决）。最后，我们使用fit方法训练集成学习模型，并使用predict方法在测试集上进行预测，最后计算准确率。