信息(information):如果待分类的事物可能划分在多个分类之中,则符号 x i x_i xi 的信息定义为: l ( x i ) = − l o g 2 p ( x i ) l(x_i) = -log_2p(x_i) l(xi)=−log2p(xi) 其中 p ( x i ) p(x_i) p(xi) 是选择该分类的概率
熵(entropy):定义为信息的期望值,即 H = − ∑ i = 1 n p ( x i ) l o g 2 p ( x i ) H = -\sum_{i=1}^np(x_i)log_2p(x_i) H=−i=1∑np(xi)log2p(xi) 其中 n 是分类的数目