问题
给定字符集 C = { x 1 , x 2 , … , x n } C=\left\{x_1,x_2,…,x_n \right\} C={x1,x2,…,xn}和每个字符的频率f(xi),求关于C的一个最优前缀码。
算法思想
哈夫曼算法:
1)初始化n个单节点的树,每个字符的概率记在树的根中,用作树的权重。
2)找到两棵权重最小的树,把它们作为新树中的左右子树,并把权重和记作新的权重记录在新树的根中。
3)重复第二步直到只剩一颗单独的树。
设计
哈夫曼算法:
输入:
C
=
{
x
1
,
x
2
,
…
,
x
n
}
C=\left\{x_1,x_2,…,x_n\right\}
C={x1,x2,…,xn}字符集,每个字符的频率
f
(
x
i
)
,
i
=
1
,
2
,
…
,
n
f(x_i),i=1,2,…,n
f(xi),i=1,2,…,n.
输出:
Q
Q
Q
n<-|C|
Q<-C //按频率递增构成队列 Q
for i<-1 to n-1 do
z<-Allocate-Node()
z.left<-Q中最小元 //取出Q中最小元作为z的左儿子
z.right<-Q中最小元 //取出Q中最小元作为z的右儿子
f(z)<-f(x)+f(y)
Insert(Q,z)
return Q
时间复杂度
O
(
n
log
n
)
O(n\log n)
O(nlogn)频率排序;
for 循环:
O
(
n
)
O(n)
O(n);
插入操作:
O
(
log
n
)
O(\log n)
O(logn)
算法时间复杂度是
O
(
n
log
n
)
O(n\log n)
O(nlogn)