互信息估计器 信息量: X= x 的信息量 熵: 代表信息量总和,是信息量的期望值,不确定性的度量。所以熵越大随机变量的取值范围越难确定,系统越不稳定。 交叉熵: P(x) 是目标分布,p,q的交叉熵可看成,使用分布q(x)表示p(x)的困难程度。 条件熵: H(Y|X)表示在已知随机变量X的条件下随机变量Y的不确定性。 相对熵(KL散度): 同一个随机变量的两个不同分布的距离。p(x),q(x) X的两个概率分布。实际应用中,p(x)是目标的真实分布,q(x)是预测得来