信息熵用来度量信息的混乱程度(不确定性),单位:比特。(信息熵越小 表示结果越确定)
信息熵的公式如下:
, i=1,2,...,n
表示所有可能的事件发生的概率。 表示可能事件发生后包含的信息量(越小概率事件发生所包含的信息量越大。例如:中国乒乓球队获胜比美国乒乓球队获胜包含的信息量少)。
根据公式可以得到:当都相等时,最大。即,当所有可能事件发生的可能性都相同时,信息熵最大。(例如:世界杯32个球队,当所有球队获胜的概率相同时,“谁是冠军”的信息熵最大,信息最混乱,不确定性最大)。
信息增益:某个条件(特征值)确定的情况下,对信息熵的减少量。