a. 对于所有字母以空格相加后,发现概率大于100% ,本人将空格键概率修改为17.3%
最优Huffman树如下:
Huffman编码为:
空格:111
e: 010
a: 1010
h: 0001
i: 0111
n: 0110
o: 1000
r: 0000
s: 0011
t: 1100
c: 00101
d: 10111
l: 10110
u: 00100
b: 100100
f: 110100
g: 100111
m: 110111
p: 100101
w: 110101
y: 100110
v: 1101100
k: 11011011
j: 1101101010
q: 1101101000
x: 1101101011
z: 1101101001
b.(3*2+4*8+5*4+6*7+7*1+8*1+9*0+10*4)/27=5.74
c.该值会比以上计算结果小,因为以上值是最理想状态下的平均值,而每个字母的概率不是一样的。
d.还可以把单词的特定前缀、后缀在文本压缩中被重点考虑。