决策树分类模型

最新推荐文章于 2023-07-04 23:21:09 发布

qq_43279936

最新推荐文章于 2023-07-04 23:21:09 发布

阅读量1.1k

点赞数

本文链接：https://blog.csdn.net/qq_43279936/article/details/100296829

版权

关于决策树分类模型：数据在不断分裂的递归过程中，每一次分裂，尽可能让类别一样的数据在树的一边，当树的叶子节点的数据都是一类的时候，则停止分裂。

单颗决策树缺点：

运算量大，需要一次加载所有数据进内存，并且寻找分割条件是一个极耗资源的工作。
出现异常数据时，将会对决策树产生很大影响，抗干扰能力差

基于单决策树的缺点，出现了随机森林分类模型，其原理是生成树的数据都是从数据集中随机选取一部分。

示例：

import numpy as np
from sklearn.tree import DecisionTreeRegressor
import matplotlib.pyplot as plt

N = 100
x = np.random.rand(N) * 6 - 3
x.sort()

y = np.sin(x) + np.random.rand(N) * 0.05
# print(y)

x = x.reshape(-1, 1)
# print(x)

dt_reg = DecisionTreeRegressor(criterion='mse', max_depth=3)
dt_reg.fit(x, y)

x_test = np.linspace(-3, 3, 50).reshape(-1, 1)
y_hat = dt_reg.predict(x_test)

x_test = np.linspace(-3, 3, 50).reshape(-1, 1)
y_hat = dt_reg.predict(x_test)

plt.plot(x, y, "y*", label="actual")
plt.plot(x_test, y_hat, "b-", linewidth=2, label="predict")
plt.legend(loc="upper left")
plt.grid()
plt.show()



# 比较不同深度的决策树
depth = [2, 4, 6, 8, 10]
color = 'rgbmy'
dt_reg = DecisionTreeRegressor()
plt.plot(x, y, "ko", label="actual")
x_test = np.linspace(-3, 3, 50).reshape(-1, 1)
for d, c in zip(depth, color):
    dt_reg.set_params(max_depth=d)
    dt_reg.fit(x, y)
    y_hat = dt_reg.predict(x_test)
    plt.plot(x_test, y_hat, '-', color=c, linewidth=2, label="depth=%d" % d)
plt.legend(loc="upper left")
plt.grid(b=True)
plt.show()

qq_43279936

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
决策树分类模型

关于决策树分类模型：数据在不断分裂的递归过程中，每一次分裂，尽可能让类别一样的数据在树的一边，当树的叶子节点的数据都是一类的时候，则停止分裂。单颗决策树缺点：运算量大，需要一次加载所有数据进内存，并且寻找分割条件是一个极耗资源的工作。出现异常数据时，将会对决策树产生很大影响，抗干扰能力差基于单决策树的缺点，出现了随机森林分类模型，其原理是生成树的数据都是从数据集中随机选取一部分。示例...
复制链接

扫一扫