(a)
字符 | 出现频率 | 哈夫曼编码 |
| 字符 | 出现频率 | 哈夫曼编码 |
| 字符 | 出现频率 | 哈夫曼编码 |
空格 | 18.3% | 111 |
| r | 4.8% | 0000 |
| y | 1.6% | 100110 |
e | 10.2% | 010 |
| d | 3.5% | 10111 |
| p | 1.6% | 100101 |
t | 7.7% | 1100 |
| l | 3.4% | 10110 |
| b | 1.3% | 100100 |
a | 6.8% | 1010 |
| c | 2.6% | 00101 |
| v | 0.9% | 1101100 |
o | 5.9% | 1000 |
| u | 2.4% | 00100 |
| k | 0.6% | 11011011 |
i | 5.8% | 0111 |
| m | 2.1% | 110111 |
| j | 0.2% | 110110100 |
n | 5.5% | 0110 |
| w | 1.9% | 110101 |
| x | 0.2% | 1101101011 |
s | 5.1% | 0011 |
| f | 1.8% | 110100 |
| q | 0.1% | 11011010100 |
h | 4.9% | 0001 |
| g | 1.7% | 100111 |
| z | 0.1% | 11011010101 |
(b)
(11*2+10+9+8+7+6*7+5*4+4*8+3*2)/27=52/9
取整数位,则每个字母的编码平均需要6位。
(c)
熵约为5.74,结果肯定比熵(大约4.139)要大,因为在计算熵的时候允许有小数个比特,而实际上每个字符的编码长度都必需为整数。
(d)
可以把考虑把特定的前缀,后缀或者是整个单词组合起来考虑。