![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
决策树及衍生
远行人_Xu
nlp工程师
展开
-
“熵”与“基尼不纯度”同为判断混乱程度的标准
“熵”与“基尼不纯度”同为判断混乱程度的标准1、信息熵 信息论中的信息量和信息熵。 信息量: 信息量是对信息的度量,就跟温度的度量是摄氏度一样,信息的大小跟随机事件的概率有关。 例如: 在哈尔滨的冬天,一条消息说:哈尔滨明天温度30摄氏度,这个事件肯定会引起轰动,因为它发生的概率很小(信息量大)。日过是夏天,“明天温度30摄氏度”可能没有人觉得是一个新闻,因为夏天温度30摄氏度太正...转载 2018-02-18 10:23:04 · 1777 阅读 · 0 评论 -
bagging和随机森林的原理和区别
来自西瓜书 区别在于,随机森林在采样时不仅“重采样”,而且只选了部分的“列”(特征)。好处就是第三张图的上面的三个小图,可以出来更多的线来用。...原创 2018-02-18 12:09:23 · 7840 阅读 · 3 评论