修改:将“空格”出现的频率修改为17.3。
(a)
Huffman编码为:
空格:111
e: 010
a: 1010
h: 0001
i: 0111
n: 0110
o: 1000
r: 0000
s: 0011
t: 1100
c: 00101
d: 10111
l: 10110
u: 00100
b: 100100
f: 110100
g: 100111
m: 110111
p: 100101
w: 110101
y: 100110
v: 1101100
k: 11011011
j: 1101101010
q: 1101101000
x: 1101101011
z: 1101101001
(b)(3*2+4*8+5*4+6*7+7*1+8*1+9*0+10*4)/27=5.74
(c)在(b)中的计算结果肯定比熵要大。
因为在计算信息熵的时候允许有小数个比特,而实际上每个字符的编码长度都必须为整数。
(d)不是。
还可以把特定的前缀。后缀或者是整个单词组合起来考虑。