决策树的三种常见算法

最新推荐文章于 2024-06-18 15:40:50 发布

Iris__HU

最新推荐文章于 2024-06-18 15:40:50 发布

阅读量1.5w

点赞数 12

分类专栏：机器学习文章标签：决策树算法机器学习

本文链接：https://blog.csdn.net/huxiyan450/article/details/107639927

版权

用途&组成

决策树是一个监督学习模型，可用于分类和回归，它是一个由内节点和叶节点构成的树型结构。每个内节点对应了一个关于某种特征的测试（Decision），通过测试，可以把样本分开（split）。最后位于同一叶子节点的样本被分为某一类。

决策树的构造有三个重要的步骤：

构造决策树时，一个首先需要考虑的问题是选择哪一个特征来作为划分样本的依据。为了比较不同的特征间的优劣，需要设计一个metric来衡量它们的performance。常用到的metric有三种：

熵（Entropy）：事物的不确定性，越不确定，熵越大。一个随机变量X的熵的计算如下：
$E(X)=\sum_{X=1}^{n}-\ p_i\ log(p_i)$
$X = 1 . . . n :$ 随机变量X有n种不同的取值
$p_i：$ 每种取值对应的可能性为 $p_i$
随机变量均匀分布时，熵达到最大。即均匀分布的不确定性最强。而n类平均分布的熵会小于n+1类平均分布的熵。
联合熵：随机变量X与Y的联合熵
$\begin{aligned} H(X,Y)&=\sum_{x_i\in X}\sum_{y_j\in Y}-\ p(x_i,y_j)\ log(p(x_i,y_j))\\ &=\sum_{x_i\in X}\sum_{y_j\in Y}-\ p(x_i,y_j)\ log(p(x_i|y_j)p(y_j))\\ \\ &=-\sum_{x_i\in X}\sum_{y_j\in Y}\ p(x_i,y_j)\ log(p(y_j))-\sum_{x_i\in X}\sum_{y_j\in Y}\ p(x_i,y_j)\ log(p(x_i|y_j))\\ \\ &=-\sum_{y_j\in Y}\sum_{x_i\in X}\ p(x_i,y_j)\ log(p(y_j))-\sum_{x_i\in X}\sum_{y_j\in Y}\ p(x_i,y_j)\ log(p(x_i|y_j))\\ \\ &=-\sum_{y_j\in Y}\ p(y_j)\ log(p(y_j))-\sum_{x_i\in X}\sum_{y_j\in Y}\ p(x_i,y_j)\ log(p(x_i|y_j))\\ \\ &=H(Y)+H(X|Y) \\ &=H(X)+H(Y|X) \\ \end{aligned}$

关注

专栏目录