假如我有A,B,C,D,E五个字符,出现的频率(即权值)分别为5,4,3,2,1,那么我们第一步先取两个最小权值作为左右子树构造一个新树,即取1,2构成新树,其结点为1+2=3,如图:
虚线为新生成的结点,第二步再把新生成的权值为3的结点放到剩下的集合中,所以集合变成{5,4,3,3},再根据第二步,取最小的两个权值构成新树,如图:
再依次建立哈夫曼树,如下图:
其中各个权值替换对应的字符即为下图:
所以各字符对应的编码为:A->11,B->10,C->00,D->011,E->010
讨论5.2 判别是否是前缀码的算法
假如已知所有字符的哈夫曼编码,则可以建一棵哈夫曼树。 在建树的过程中,定义一个指针,每次都从树根开始。每读入一个编码时,如果是0,则p指向此时p的左孩子,如果是1,指向p的右孩子。 当已经读完时,判断p指针的左右孩子是否都为空,如果是,则该编码不是之前的编码的前缀码,并在p指向的结点数据域中赋上该字符。
小测验
a节点的度为1。哈夫曼树结点的度不能为1,只能为0或2。所以不对。
另:
画出来第一个发现就是不可能的,要知道,这里的又没有开头就是0的其他编码,怎么能直接来个00呢。
即如果把A选项的00变为0,这就是哈夫曼编码了。答案选A。
选B。画图如下:
文本所占总位数=3X1+3X2+2X2+2X3+2X4=27