机器学习经典算法之决策树

最新推荐文章于 2023-07-07 19:54:06 发布

啦啦啦12345678900000000

最新推荐文章于 2023-07-07 19:54:06 发布

阅读量410

点赞数 1

分类专栏：机器学习

本文链接：https://blog.csdn.net/ZHANGJING199402/article/details/105164620

版权

基础知识熵/信息熵：熵描述了数据的混乱程度，熵越大，混乱程度越高，也就是纯度越低；反之，熵越小，混乱程度越低，纯度越高。熵的计算公式如下所示：Entropy=−∑i=1kpilog2(pi)Entropy=-\sum_{i=1}^kp_ilog_2(p_i)Entropy=−∑i=1kpilog2(pi)条件熵：随机变量X给定的条件下随机变量YYY的条件熵H(Y∣X)=∑i=1npi...

摘要由CSDN通过智能技术生成

基础知识

熵/信息熵：熵描述了数据的混乱程度，熵越大，混乱程度越高，也就是纯度越低；反之，熵越小，混乱程度越低，纯度越高。熵的计算公式如下所示： $Entropy=-\sum_{i=1}^kp_ilog_2(p_i)$

条件熵：随机变量X给定的条件下随机变量 $Y$ 的条件熵 $H(Y|X)=\sum_{i=1}^np_iH(Y|X=x_i)$

当熵和条件熵中的概率由数据估计（特别是极大似然估计）得到时，所对应的熵和条件熵分别称为经验熵和经验条件熵。

相对熵：

联合熵：联合概率分布， $H(x,y)=-\sum_{i=1}^n\sum_{j=1}^mp(x_i,y_j)log_2p(x_i,y_j)$

互信息：

信息增益：特征 $A$ 对训练数据集 $D$ 的信息增益 $g (D, A)$ 即为经验熵 $H (D)$ -经验条件熵 $H (D ∣ A)$ ，其中 $KaTeX parse error: Undefined control sequence: \C at position 48: …D|}log_2\frac{|\̲C̲_k|}{|D|}$ ， $H(D|A)=\sum_{i=1}^{n}\frac{|D_i|}{|D|}H(D_i)=-\sum_{i=1}^n\frac{|D_i|}{|D|}\sum_{k=1}^K\frac{|D_{ik}|}{|D_i|}log_2\frac{|D_{ik}|}{|D_i|}$

最低0.47元/天解锁文章

啦啦啦12345678900000000

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习经典算法之决策树

基础知识熵/信息熵：熵描述了数据的混乱程度，熵越大，混乱程度越高，也就是纯度越低；反之，熵越小，混乱程度越低，纯度越高。熵的计算公式如下所示：Entropy=−∑i=1kpilog2(pi)Entropy=-\sum_{i=1}^kp_ilog_2(p_i)Entropy=−∑i=1kpilog2(pi)条件熵：随机变量X给定的条件下随机变量YYY的条件熵H(Y∣X)=∑i=1npi...
复制链接

扫一扫