图片取自http://colah.github.io/posts/2015-09-Visual-Information/
基本概念
(1)熵,也叫信息熵,为上图的 H ( X ) H(X) H(X)与 H ( Y ) H(Y) H(Y)。
H ( X ) H(X) H(X)表示随机变量 Y Y Y的不确定性。
H ( Y ) H(Y) H(Y)表示随机变量 X X X的不确定性。
(2)条件熵,为上图的 H ( X ∣ Y ) H(X|Y) H(X∣Y)与 H ( Y ∣ X ) H(Y|X) H(Y∣X)。
H ( X ∣ Y ) H(X|Y) H(X∣Y)表示在已知随机变量 Y Y Y的条件下,随机变量 X X X的不确定性。
H ( Y ∣ X ) H(Y|X) H(Y∣X)表示在已知随机变量 X X X的条件下,随机变量 Y Y Y的不确定性。
(3)联合熵,为上图的 H ( X , Y ) H(X,Y) H(X,Y)。
H ( X , Y ) H(X,Y)