条件熵, 是增加了X变量之后Y的不确定度 , 那么如果X携带有Y相关性信息, 那么X得知Y之后的不确定度自然减少, 也就是条件熵小于原先的熵, 数学上表现就是jenssen不等式, 只有在X对Y没有信息时候才取等号