决策树机器学习

最新推荐文章于 2024-08-16 21:01:11 发布

withoutp

最新推荐文章于 2024-08-16 21:01:11 发布

阅读量279

点赞数 5

文章标签：决策树算法机器学习

本文链接：https://blog.csdn.net/withoutp/article/details/138327657

版权

决策树是一种用于分类和回归分析的模型，其基于树形结构进行决策。每个内部节点表示属性上的测试，每个分支代表测试的结果，而每个叶子节点代表一种类别或数值。生成决策树的过程是自顶向下的递归划分数据，直至满足停止条件。

决策树具备以下特点：

可解释性：决策树生成直观，易于理解和解释，常用于决策支持系统。
处理多种数据类型：能处理分类、连续和缺失数据等多种数据类型。
自动特征选择：通过选择分裂属性进行特征选择，选择具有最大区分度的属性。
适用于大规模数据：决策树可扩展到大规模数据集。
常见决策树算法有三种：

ID3（Iterative Dichotomiser 3）：基于信息增益选择分裂属性的经典算法。
C4.5： ID3的改进版本，支持连续属性、缺失值处理和剪枝操作。
CART（Classification and Regression Trees）：使用基尼系数进行属性选择，适用于分类和回归问题。
下面以ID3和CART算法为例进行讲解。

ID3算法：使用信息增益选择最佳分裂属性，生成易于解释的决策树模型。虽然简单易懂，但对缺失值敏感，不处理连续型属性，容易过拟合。

CART算法：使用基尼系数选择分裂属性，生成二叉树结构。适用于分类和回归问题，能处理多种数据类型。

这里给出了使用scikit-learn库中DecisionTreeClassifier类建立ID3和CART决策树模型的示例代码，并通过plot_tree函数可视化生成的决策树结构。在示例中，两种算法可能会选择相同的分裂特征，但树结构和属性选择方法会有所不同。

CRAT（Constrained Resource Allocation Tree）算法是一种进化算法，旨在解决存在约束条件的资源分配问题。它通过不断优化资源分配，在满足约束条件的同时，最大化或最小化特定的目标函数。CRAT算法在项目管理、生产计划和资源优化等领域有广泛应用。

CRAT算法的主要步骤包括初始化、评估、选择、交叉、变异、再评估和再选择，重复这些步骤直到达到终止条件。其优势在于能够处理复杂约束条件，灵活调整资源分配以满足多样化需求。

以下是一个案例，假设有1000人，节点为游戏时间是否较长。其中成绩及格的700人中只有100人游戏时间长，而成绩不及格的300人中有200人游戏时间长。

下面使用Python的scikit-learn库，分别利用ID3和CART算法建立决策树模型。

ID3算法示例代码：

python
复制代码

from sklearn.tree import DecisionTreeClassifier
from sklearn.tree import plot_tree
import matplotlib.pyplot as plt

# 准备训练数据
features = [[1, 0], [1, 0], [1, 1], [1, 1], [0, 1], [0, 1], [0, 0], [0, 0]]
labels = [1, 1, 1, 1, 0, 0, 0, 0]

# 创建ID3决策树模型
id3_model = DecisionTreeClassifier(criterion='entropy')
id3_model.fit(features, labels)

# 可视化ID3决策树
plt.figure(figsize=(8, 4))
plot_tree(id3_model, filled=True, rounded=True, feature_names=['游戏时长', '成绩及格'], class_names=['不及格', '及格'])
plt.show()
CART算法示例代码：

python
复制代码

from sklearn.tree import DecisionTreeClassifier
from sklearn.tree import plot_tree
import matplotlib.pyplot as plt

# 准备训练数据
features = [[1, 0], [1, 0], [1, 1], [1, 1], [0, 1], [0, 1], [0, 0], [0, 0]]
labels = [1, 1, 1, 1, 0, 0, 0, 0]

# 创建CART决策树模型
cart_model = DecisionTreeClassifier(criterion='gini')
cart_model.fit(features, labels)

# 可视化CART决策树
plt.figure(figsize=(8, 4))
plot_tree(cart_model, filled=True, rounded=True, feature_names=['游戏时长', '成绩及格'], class_names=['不及格', '及格'])
plt.show()
在这里，我们将"游戏时间长"表示为1，"游戏时间不长"表示为0；"成绩及格"表示为1，"成绩不及格"表示为0。

以上代码利用scikit-learn库的DecisionTreeClassifier类分别构建了ID3和CART决策树模型，并使用plot_tree函数进行可视化展示。虽然两种算法可能选择相同的分裂特征，但生成的树结构和属性选择方法可能有所不同。

withoutp

关注

5
点赞
踩
9

收藏

觉得还不错? 一键收藏
1
评论
决策树机器学习

在示例中，两种算法可能会选择相同的分裂特征，但树结构和属性选择方法会有所不同。plot_tree(cart_model, filled=True, rounded=True, feature_names=['游戏时长', '成绩及格'], class_names=['不及格', '及格'])plot_tree(id3_model, filled=True, rounded=True, feature_names=['游戏时长', '成绩及格'], class_names=['不及格', '及格'])
复制链接

扫一扫

决策树 机器学习

决策树机器学习