机器学习应用篇（四）——基于决策树算法的分类预测

最新推荐文章于 2022-03-26 11:55:19 发布

柚子味的羊

最新推荐文章于 2022-03-26 11:55:19 发布

阅读量1.1k

点赞数

分类专栏：机器学习文章标签：机器学习决策树算法

本文链接：https://blog.csdn.net/qq_43368987/article/details/122357174

版权

机器学习专栏收录该内容

33 篇文章 25 订阅

订阅专栏

机器学习应用篇（四）——基于决策树算法的分类预测

文章目录

机器学习应用篇（四）——基于决策树算法的分类预测

一、决策树的特点

1.优点

具有很好的解释性，模型可以生成可以理解的规则。
可以发现特征的重要程度。
模型的计算复杂度较低。

2.缺点

模型容易过拟合，需要采用减枝技术处理。
不能很好利用连续型特征。
预测能力有限，无法达到其他强监督模型效果。
方差较高，数据分布的轻微改变很容易造成树结构完全不同。

二、决策树的适用场景

决策树模型多用于处理自变量与因变量是非线性的关系。
梯度提升树（GBDT），XGBoost以及LightGBM等先进的集成模型均采用决策树作为基模型。（多粒度联森林模型）
决策树在一些明确需要可解释性或者提取分类规则的场景中被广泛应用。在医疗辅助系统中为了方便专业人员发现错误，常常将决策树算法用于辅助病症检测。

三、demo

#%%demo
##  基础函数库导入
import numpy as np 

## 导入画图库
import matplotlib.pyplot as plt
import seaborn as sns

## 导入决策树模型函数
from sklearn.tree import DecisionTreeClassifier
from sklearn import tree
import pydotplus 
from IPython.display import Image
##Demo演示DecisionTree分类
## 构造数据集
x_fearures = np.array([[-1, -2], [-2, -1], [-3, -2], [1, 3], [2, 1], [3, 2]])
y_label = np.array([0, 1, 0, 1, 0, 1])
## 调用决策树回归模型
tree_clf = DecisionTreeClassifier()
## 调用决策树模型拟合构造的数据集
tree_clf = tree_clf.fit(x_fearures, y_label)
## 可视化构造的数据样本点
plt.figure()
plt.scatter(x_fearures[:,0],x_fearures[:,1], c=y_label, s=50, cmap='viridis')
plt.title('Dataset')
plt.show()
## 可视化决策树
import graphviz
dot_data = tree.export_graphviz(tree_clf, out_file=None)
graph = pydotplus.graph_from_dot_data(dot_data)
graph.write_pdf("D:\Python\ML\DecisionTree.pdf") 
# 模型预测
## 创建新样本
x_fearures_new1 = np.array([[0, -1]])
x_fearures_new2 = np.array([[2, 1]])

## 在训练集和测试集上分布利用训练好的模型进行预测
y_label_new1_predict = tree_clf.predict(x_fearures_new1)
y_label_new2_predict = tree_clf.predict(x_fearures_new2)

print('The New point 1 predict class:\n',y_label_new1_predict)
print('The New point 2 predict class:\n',y_label_new2_predict)

运行结果
在这里插入图片描述
训练集决策树

明天继续，还有一个决策树在真实数据集上的应用，明天出。先搞课题~

柚子味的羊

关注

0
点赞
踩
9

收藏

觉得还不错? 一键收藏
打赏
0
评论
机器学习应用篇（四）——基于决策树算法的分类预测

机器学习应用篇（四）——基于决策树算法的分类预测文章目录机器学习应用篇（四）——基于决策树算法的分类预测一、决策树的特点1.优点2.缺点二、决策树的适用场景三、demo一、决策树的特点1.优点具有很好的解释性，模型可以生成可以理解的规则。可以发现特征的重要程度。模型的计算复杂度较低。2.缺点模型容易过拟合，需要采用减枝技术处理。不能很好利用连续型特征。预测能力有限，无法达到其他强监督模型效果。方差较高，数据分布的轻微改变很容易造成树结构完全不同。二、决策树的适用场景决策树
复制链接

扫一扫