5-18:
答案的呈现以纸质版为主,所以并不足够美观:
(a):
空格:111
a :1001
d :11000
e :000
f :100000
g :101000
h :0100
i :0011
j :1100111100
k :1100111
l :10001
m :110010
n :0010
o :1011
p :101010
q :1100111110
r :0111
s :0101
t :1101
u :01101
v :1100110
w :100001
x :1100111101
y :101001
z :1100111111
(b):
每个字母的编码平均需要5位。
(c):
计算出来的结果可能会偏大些,因为计算熵的值时,会用到小数点,值会偏大点。
(d):
这不是英文的文本压缩下限。其实可以将英文出现的单词相同的前缀和后缀考虑进去,这样被压缩的文本将会更小。