决策树原理及代码

最新推荐文章于 2024-08-26 20:49:37 发布

大叔1018

最新推荐文章于 2024-08-26 20:49:37 发布

阅读量422

点赞数 15

文章标签：决策树

本文链接：https://blog.csdn.net/weixin_51305383/article/details/140203302

版权

决策树（Decision Tree）是一种常见的机器学习算法，用于解决分类和回归问题。决策树模型通过将数据集分割成不同的子集，构建一个树形结构来进行预测。

决策树的原理如下：
1. 根据训练集中的特征和目标变量，选择一个最优的特征分割点作为根节点。
2. 根据该特征分割点的取值将数据集划分为多个子集，每个子集对应树中的一个分支。
3. 对于每个子集，重复步骤1和步骤2，直到满足以下条件之一：
- 子集中的样本属于同一类别（分类问题）或具有相似的数值（回归问题）。
- 达到预定的树的最大深度。
- 达到预定的节点个数。
- 样本数小于预定的最小样本数。
4. 构建完成的决策树可以用于预测新的未知样本。

以下是一个示例代码，使用Python的sklearn库中的DecisionTreeClassifier类来构建决策树模型，并使用鸢尾花数据集进行分类预测：

```python
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import accuracy_score

# 加载鸢尾花数据集
iris = load_iris()
X = iris.data
y = iris.target

# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# 构建决策树模型
model = DecisionTreeClassifier()

# 拟合模型
model.fit(X_train, y_train)

# 在测试集上进行预测
y_pred = model.predict(X_test)

# 计算准确率
accuracy = accuracy_score(y_test, y_pred)
print("准确率：", accuracy)
```

这段代码首先导入了所需要的库，然后加载了鸢尾花数据集，划分了训练集和测试集。接着，使用DecisionTreeClassifier类创建了一个决策树模型，并调用fit方法拟合模型。最后，在测试集上进行预测，并计算了预测准确率。

大叔1018

关注

15
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
决策树原理及代码

这段代码首先导入了所需要的库，然后加载了鸢尾花数据集，划分了训练集和测试集。接着，使用DecisionTreeClassifier类创建了一个决策树模型，并调用fit方法拟合模型。最后，在测试集上进行预测，并计算了预测准确率。决策树模型通过将数据集分割成不同的子集，构建一个树形结构来进行预测。2. 根据该特征分割点的取值将数据集划分为多个子集，每个子集对应树中的一个分支。1. 根据训练集中的特征和目标变量，选择一个最优的特征分割点作为根节点。4. 构建完成的决策树可以用于预测新的未知样本。
复制链接

扫一扫