P 167 下表给出了英文字母(包括用于分割单词的空格)在某文集中的出现频率
根据字母和空格的概率画出Huffman树
(a)这些字母的最优Huffman编码如下图
(b )每个字母的编码平均需要 (10*4+8+7+6*7+5*4+4*8+3*2)/27=5.74
(c) 该值会比以上的结果还要大,计算熵的时候有小数位,而实际上每个每个字符的编码的长度都是整数
(d) 这不是英文文本压缩的下限,应该考虑到前后缀以及英文词根等。
P 167 下表给出了英文字母(包括用于分割单词的空格)在某文集中的出现频率
根据字母和空格的概率画出Huffman树
(a)这些字母的最优Huffman编码如下图
(b )每个字母的编码平均需要 (10*4+8+7+6*7+5*4+4*8+3*2)/27=5.74
(c) 该值会比以上的结果还要大,计算熵的时候有小数位,而实际上每个每个字符的编码的长度都是整数
(d) 这不是英文文本压缩的下限,应该考虑到前后缀以及英文词根等。