概率 最大似然估计——用频率代替概率 条件概率 全概率公式 划分 全概率公式 贝叶斯法则 其实就是把条件概率的分子做了一个变形 贝叶斯决策法则 二项分布 伯努利 信息论 熵 事件的不确定性,随机变量的不确定性 和出现的所有事件个数,以及各事件的可能性有关 联合熵 条件熵 连琐法则 熵率 交叉熵 衡量模型和真实概率之间的差距 困惑度 困惑度和交叉熵呈指数关系 互信息 指X中包含的Y的信息量 即知道了X之后,能知道多少Y 双字耦合度 噪声信道模型