集成学习（二）—— 随机森林

最新推荐文章于 2024-06-29 18:48:32 发布

木子六日

最新推荐文章于 2024-06-29 18:48:32 发布

阅读量445

点赞数

分类专栏：机器学习/深度学习文章标签：决策树机器学习 python

本文链接：https://blog.csdn.net/Paul_1i/article/details/104349196

版权

机器学习/深度学习专栏收录该内容

22 篇文章 2 订阅

订阅专栏

随机森林

简介

随机森林就是决策树+bagging+随机属性。

就是说在决策树的基础上，使用bagging搞了多个模型最后投票决定分类。另外不同数据集之间的属性也可能是不一样的，因为不仅是样本随机选，属性也是随机选的，可能在这个数据集里样本有abc三个属性，到了另一个数据集里就是def三个属性了。

大概就是这样吧，也没啥好说的。

sklearn实现随机森林

import numpy as np
import matplotlib.pyplot as plt
from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import train_test_split

# 载入数据
data = np.genfromtxt('../data/LR-testSet2.txt',delimiter=',')
xdata = data[:,:-1]
ydata = data[:,-1]

# 切分训练集测试集
xtrain,xtest,ytrain,ytest = train_test_split(xdata,ydata,test_size=0.5)

# 画图函数
def plot(model):
    xmin,xmax = xdata[:,0].min()-1,xdata[:,0].max()+1
    ymin,ymax = xdata[:,1].min()-1,xdata[:,1].max()+1
    xx,yy = np.meshgrid(np.arange(xmin,xmax,0.02),
                        np.arange(ymin,ymax,0.02))
    z = model.predict(np.c_[xx.ravel(),yy.ravel()])
    z = z.reshape(xx.shape)
    cs = plt.contourf(xx,yy,z)
    plt.scatter(xtest[:,0],xtest[:,1],c=ytest)
    plt.show()
    
RF = RandomForestClassifier(n_estimators=50)
RF.fit(xtrain,ytrain)
plot(RF)

木子六日

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
集成学习（二）—— 随机森林

随机森林简介随机森林就是决策树+bagging+随机属性。就是说在决策树的基础上，使用bagging搞了多个模型最后投票决定分类。另外不同数据集之间的属性也可能是不一样的，因为不仅是样本随机选，属性也是随机选的，可能在这个数据集里样本有abc三个属性，到了另一个数据集里就是def三个属性了。大概就是这样吧，也没啥好说的。sklearn实现随机森林import numpy as...
复制链接

扫一扫

专栏目录