机器学习

最新推荐文章于 2024-05-02 21:46:15 发布

山腰的旅行

最新推荐文章于 2024-05-02 21:46:15 发布

阅读量109

点赞数

分类专栏： Machine Learning Deep Learning 文章标签： Machine Learning Pattern Recognition

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/taiyangwangzi/article/details/89328243

版权

Deep Learning 同时被 2 个专栏收录

2 篇文章 0 订阅

订阅专栏

Machine Learning

1 篇文章 0 订阅

订阅专栏

Resources

Pattern Recognition and Machine Learning
<<模式识别与机器学习>>
Christopher Bishop
PRML-PDF
Source Code:
refer Pattern Recognition and Machine Learning Toolbox
Matlab: git clone https://github.com/PRML/PRMLT.git
Python: git clone https://github.com/ctgk/PRML.git
Machine Learning and Computational Statistics
David Rosenberg
github.io
动手学深度学习
动手学深度学习

Others

熵

熵作为混乱程度的度量。纯度。
$\sum_{i=1}^{n} P_i ln(P_i)$
信息增溢越大越好
信息增溢率（信息增溢除以自身的熵值）

Gini coefficient

$Gini(P)=\sum_{k=1}^{K} p_k (1-p_k)=1-\sum_{k=1}^{K} {p_k}^2$

评价函数

$\sum_{t\in leaf} N_t H(t)$
H(t):　熵或Gini系数
N_t:　当前页子结点所含样本的数量 (权重)
评价函数越小越好
损失函数

决策树

构造树的基本思想：
随着树的深度的增加，节点的熵迅速地降低。熵降低的速度走越快越好，这样有望等到一棵高度最矮的决策数。
如何选根结点：选择信息增溢（信息增溢率）最大的那个

在这里插入图片描述

References

机器学习第二阶段：机器学习经典算法（2）——决策树与随机森林

山腰的旅行

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
机器学习

熵熵作为混乱程度的度量。纯度。熵=−∑i=1nPiln(Pi)熵=- \sum_{i=1}^{n} P_i ln(P_i) 熵=−i=1∑nPiln(Pi)信息增溢越大越好信息增溢率（信息增溢除以自身的熵值）Gini coefficientGini(P)=∑k=1Kpk(1−pk)=1−∑k=1Kpk2Gini(P)=\sum_{k=1}^{K} p_k (1-p_k)=1-\s...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。