2-2 机器学习 -- 随机森林

最新推荐文章于 2023-03-23 22:22:43 发布

qq_41134008

最新推荐文章于 2023-03-23 22:22:43 发布

阅读量234

点赞数

分类专栏：机器学习

本文链接：https://blog.csdn.net/qq_41134008/article/details/103521888

版权

机器学习专栏收录该内容

6 篇文章 0 订阅

订阅专栏

一、随机森林：

随机森林：多颗决策树构建而成，每一颗树都是决策树。在分类器构造中引入随机性来创建多样化的分类器集。

多颗决策树一起运算 ---------- 》集成算法随机森林，极限森林。

随机性体现：

1、抽样的随机性
2、分裂条件随机（选最好的裂分条件）。

随机性的目的：减少森林估计量的方差

过拟合：

欠拟合：

单个决策树通常表现出较高的方差并且倾向于过渡拟合，随机森林中注入的随机性产生决策树，其预测误差有些解耦，通过取这些预测的平均值，可以消除一些误差，随机森林通过组合不同的树木来减少变化，有时会以略微增加偏差为代价。在实践中，方差减小通常很明显，因此产生了总体上更好的模型。

二、代码演练

import numpy as np

# 绘制图
import matplotlib.pyplot as plt
%matplotlip inline

# 随机森林算法
from sklearn.ensemble import RandomForestClassifier

# 获取数据集
from sklearn import datasets
import pandas as pd

# 随机切分数据集
from sklearn.model_selection import train_test_split

# 加载数据
wine = datasets.load_wine()
X = wine['data']
y = wine['target']

# 随机切分数据
X_train,X_test,y_train,y_test = train_test_split(X,y,test_size=0.2)

# 算法选择
clf = RandomForestClassifier(n_estimators=100)

# 训练数据
clf.fit(X_train,y_train)

# 预测数据
y_ = clf.predict(X_test)

# 计算准确率
from sklearn.metrics import accuracy_score
accuracy_score(y_test,y_)

qq_41134008

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
2-2 机器学习 -- 随机森林

一、随机森林：随机森林：多颗决策树构建而成，每一颗树都是决策树。在分类器构造中引入随机性来创建多样化的分类器集。多颗决策树一起运算 ---------- 》集成算法随机森林，极限森林。随机性体现：抽样的随机性，每一颗树划分标准的随机性。随机性的目的：减少森林估计量的方差过拟合：欠拟合：单个决策树通常表现出较高的方差并且倾向于过渡拟合，随机森林中注入的随机性产生决策树，其预测误差有些...
复制链接

扫一扫