通俗理解:
信息熵是描述事物的复杂程度,即一件事发生的不确定性。
信息增益是指一个节点分裂后对这个事件不确定性或者纯度带来的影响。
当一件事发生的可能性越低时,其不确定性越大,相应的纯度越低
信息增益在分类任务中的作用表现在,通过计算信息熵,看哪个属性对分类结果的影响最大。
基本表示
信息熵,表示X事件发生的不确定性。
条件熵,表示,在X的情况下,Y带来的不确定性
信息增益
信息熵是描述事物的复杂程度,即一件事发生的不确定性。
信息增益是指一个节点分裂后对这个事件不确定性或者纯度带来的影响。
当一件事发生的可能性越低时,其不确定性越大,相应的纯度越低
信息增益在分类任务中的作用表现在,通过计算信息熵,看哪个属性对分类结果的影响最大。
信息熵,表示X事件发生的不确定性。
条件熵,表示,在X的情况下,Y带来的不确定性
信息增益