(1)在决策树的每一个非叶子结点划分之前,先计算每一个属性所带来的信息增益,选择最大信息增益的属性来划分,
因为信息增益(原系统熵-该属性比例X该属性的熵)越大,区分样本的能力就越强,越具有代表性,很显然这是一种自顶向下的贪心策略。
(2) 原信息的混乱程度很严重,所以熵比较大;
而知道某个属性和原信息有关时,相当于知道了更多的信息,所以原信息的混乱程度减少(熵减少),信息增益会变大
信息增益最通俗解释
最新推荐文章于 2023-12-23 17:44:16 发布
(1)在决策树的每一个非叶子结点划分之前,先计算每一个属性所带来的信息增益,选择最大信息增益的属性来划分,
因为信息增益(原系统熵-该属性比例X该属性的熵)越大,区分样本的能力就越强,越具有代表性,很显然这是一种自顶向下的贪心策略。
(2) 原信息的混乱程度很严重,所以熵比较大;
而知道某个属性和原信息有关时,相当于知道了更多的信息,所以原信息的混乱程度减少(熵减少),信息增益会变大
打赏作者