先将信源符号的概率按从小到大排序,将最小两个的概率分别标记为0和1,相加;
重新再一轮排序,也按照从小到大,仍然将最小的两个概率标记0和1,相加;
直到最后相加的总概率为1.0,即完成。
码字W1是按照对应一行的信源符号ai的概率p(ai)在编码过程中担任了0or1,先标记的数字在后面,后标记的在前面。
码长Ki为二进制码字的位数。
将表5-5和5-6中编码过程横向看即可发现,将括号指向的箭头的数字所在的那一行信源符号ai作为根节点,能够形成为哈夫曼树,即是图5-7中竖向看的哈夫曼树。
因为此编码中最后两个概率最小符号,用0和1是可以任意的,所以可以得到不同的哈夫曼码,即表格中码字Wi不是唯一的,得到的码不是唯一码。但码长是一定的,即不被影响。
两种哈夫曼编码,经计算,平均码长相等,编码效率一致,从码方来看,表格5-6方差小,质量要好,充分利用短码。