7.7 赫夫曼树应用解析(叶子到根逆向求每个字符的赫夫曼编码)

赫夫曼树(Huffman):又称最优树,是一类带权路径长度最短的树。带权路径长度最小的二叉树称作

最优二叉树赫夫曼树

带权路径的计算:记做WPL是路径长度节点上权的乘积。

 

构造赫夫曼树(四步骤):

1、n个权值{w1, w2,w3,…..wn}构造n棵二叉树的集合F{T1, T2, T3,…..Tn},其中每棵二叉树Ti中只有一个带权的根节点Wi,其左右子树均未空。

2、在F中选取两棵根结点的权值最小的树作为左右子树构造一棵新的二叉树,且置新的二叉树的根节点的权值为其左、右子树上根结点的权值之和。

3、在F中删除这两棵树,同时将得到的二叉树加入F中。

4、重复(2)、(3),直到F中只含一棵树为止,这便是赫夫曼树。

 

注意点:

赫夫曼树中没有度为1的结点,一棵有n个子结点的赫夫曼树公有2n-1个结点。可以存储在一个大小为2n-1的一维数组中。

在构成赫夫曼树之后,力求编码从叶子结点出发走一条叶子到根的路径

译码从根出发走一条从根到叶子的路径。则对每个结点来说,既需知道双亲的信息,又需知道孩子的信息。


下面程序: 

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
/***********************************************************/
// 程序名称:HuffmanTree.cpp
// 程序目的:设计一个叶子到根逆向求每个字符的赫夫曼编码的程序
// 程序来源:数据结构与算法分析(C语言描述) P-147
// 日期:2013-8-26 21:22:19
/***********************************************************/

#include <stdio.h>
#include <stdlib.h>
#include <limits.h>
#include <string.h>

#define Error( str )        FatalError( str )
#define FatalError( str )   fprintf( stderr,  "%s\n", str ), exit(  1 )

typedef  int ElementType;
#define MAXQUEUE  10


typedef  struct huffmantree
{
     unsigned  int weight;     // 权值
     unsigned  int parent, lchild, rchild;
} HTNode, *HuffmanTree;      // 动态分配数组存储赫夫曼树
typedef  char* *HuffmanCode;  // 动态分配数组存储赫夫曼编码表

int Min(HuffmanTree t,  int i);
void Select(HuffmanTree t,  int i,  int &s1,  int &s2);
void HuffmanTreeCoding(HuffmanTree &HT, HuffmanCode &HC,  int *w,  int n);

/************************************************************************/
// 主程序
/************************************************************************/

int main( void)
{
    HuffmanTree HT;
    HuffmanCode HC;

     int n;
    printf( "请输入权值的个数(大于1): ");
    scanf( "%d", &n);

     int* w;
    w = ( int*)malloc(n *  sizeof( int));
    printf( "请输入%d个权值的(整型): \n", n);
     for ( int i= 0; i <= n- 1; i++)
        scanf( "%d", w+i);

    HuffmanTreeCoding(HT, HC, w, n);

     for ( int i= 1; i <=n; i++)
        puts(HC[i]);

     return  0;
}

/************************************************************************/
// 获得totalNode个结点中权值最小的结点的序号
/************************************************************************/

int Min(HuffmanTree t,  int totalNodes)
{    // 返回totalNodes个结点中权值最小的根结点序号
     int minIndex =  0;
     unsigned  int unWeight = UINT_MAX;    // 无符号整型最大值
     for ( int i= 1; i <= totalNodes; i++)
    {
         if (t[i].weight < unWeight && t[i].parent ==  0)      // t[i]为根结点
        {
            unWeight = t[i].weight;
            minIndex = i;
        }
    }
    t[minIndex].parent =  1;      // 给选中的根节点双亲赋1,避免第2次查找改点

     return minIndex;
}

/************************************************************************/
// 选择权值最小的树的根结点的序号
/************************************************************************/

void Select(HuffmanTree t,  int minIndex,  int &minIndex1,  int &minIndex2)
{
    minIndex1 = Min(t, minIndex);
    minIndex2 = Min(t, minIndex);

     int tempIndex;
     if (minIndex1 > minIndex2)
    {
        tempIndex = minIndex1;
        minIndex1 = minIndex2;
        minIndex2 = tempIndex;
    }

     return;
}

/************************************************************************/
// 求解赫夫曼编码
/************************************************************************/

void HuffmanTreeCoding(HuffmanTree &HT, HuffmanCode &HC,  int* w,  int n)
// w存放n个字符的权值(均>0), 构造赫夫曼树,求出n个字符的赫夫曼编码HC
     if (n <=  1)
         return;

     int nNodes;      // 总结点和
     int nodeIndex;   // 根结点序号
    nNodes =   2 * n -  1;    

    HT = (HuffmanTree)malloc(  sizeof(HTNode) * (nNodes+ 1) );         // 0号单元未用

    HuffmanTree pTree;
    pTree = HT+ 1;
     for (nodeIndex= 1; nodeIndex <= n; ++nodeIndex,++pTree, ++w)
    {
        pTree->weight = *w;
        pTree->parent =  0;
        pTree->lchild =  0;
        pTree->rchild =  0;
    }

     for ( ; nodeIndex <= nNodes; ++nodeIndex, ++pTree)
        (*pTree).parent =  0;

     // 创建赫夫曼树
     int minIndex1, minIndex2;
     for (nodeIndex = n+ 1; nodeIndex <= nNodes; nodeIndex++)  // 循环n-1次
    {  // 在HT[1~nodeIndexs-1]中选择parent为0且weight最小的两个结点,其序号分别为minIndex1,minIndex2
        Select(HT, nodeIndex- 1, minIndex1, minIndex2);
        HT[minIndex1].parent = HT[minIndex2].parent = nodeIndex;
        HT[nodeIndex].lchild = minIndex1;
        HT[nodeIndex].rchild = minIndex2;
        HT[nodeIndex].weight = HT[minIndex1].weight + HT[minIndex2].weight;
    }

     // 从叶子到根逆向求每个字符的赫夫曼编码
    HC = (HuffmanCode)malloc( (n+ 1)* sizeof( char*));

     // 分配n个字符编码的头指针向量([0]不用)
     char* codingSize;
    codingSize = ( char*)malloc( sizeof( char) * n);    // 分配求编码的工作空间
    codingSize[n- 1] =  '\0';      // 编码结束符

     for (nodeIndex =  1; nodeIndex <= n; nodeIndex++)
    {  // 逐个字符求赫夫曼编码
         int pos;
         unsigned  int c, f;
        pos = n -  1;         // 编码结束位置

         for (c=nodeIndex, f=HT[nodeIndex].parent; f !=  0; c=f, f = HT[f].parent)
        {    // 从叶子到根逆向求编码
             if (HT[f].lchild == c)
                codingSize[--pos] =  '0';
             else
                codingSize[--pos] =  '1';
            
            HC[nodeIndex] = ( char*)malloc((n - pos) *  sizeof( char));
             // 为第i个字符编码分配空间
            strcpy(HC[nodeIndex], &codingSize[pos]);   // 从codingSize复制编码串到HC
        }
    }
                        
    free(codingSize);    // 释放工作区间

     return;
}
输出结果:


//算法5.11 赫夫曼树赫夫曼编码 #include using namespace std; typedef struct { int weight; int parent,lchild,rchild; }HTNode,*HuffmanTree; typedef char **HuffmanCode; void Select(HuffmanTree HT,int len,int &s1,int &s2) { int i,min1=0x3f3f3f3f,min2=0x3f3f3f3f;//先赋予最大值 for(i=1;i<=len;i++) { if(HT[i].weight<min1&&HT[i].parent==0) { min1=HT[i].weight; s1=i; } } int temp=HT[s1].weight;//将原值存放起来,然后先赋予最大值,防止s1被重复选择 HT[s1].weight=0x3f3f3f3f; for(i=1;i<=len;i++) { if(HT[i].weight<min2&&HT[i].parent==0) { min2=HT[i].weight; s2=i; } } HT[s1].weight=temp;//恢复原来的值 } //用算法5.10构造赫夫曼树 void CreatHuffmanTree(HuffmanTree &HT,int n) { //构造赫夫曼树HT int m,s1,s2,i; if(n<=1) return; m=2*n-1; HT=new HTNode[m+1]; //0号单元未用,所以需要动态分配m+1个单元,HT[m]表示结点 for(i=1;i<=m;++i) //将1~m号单元中的双亲、左孩子,右孩子的下标都初始化为0 { HT[i].parent=0; HT[i].lchild=0; HT[i].rchild=0; } cout<<"请输入叶子结点的权值:\n"; for(i=1;i>HT[i].weight; /*――――――――――初始化工作结束,下面开始创建赫夫曼树――――――――――*/ for(i=n+1;i<=m;++i) { //通过n-1次的选择、删除、合并来创建赫夫曼树 Select(HT,i-1,s1,s2); //在HT[k](1≤k≤i-1)中选择两个其双亲域为0且权值最小的结点, // 并返回它们在HT中的序号s1和s2 HT[s1].parent=i; HT[s2].parent=i; //得到新结点i,从森林中删除s1,s2,将s1和s2的双亲域由0改为i HT[i].lchild=s1; HT[i].rchild=s2 ; //s1,s2分别作为i的左右孩子 HT[i].weight=HT[s1].weight+HT[s2].weight; //i 的权值为左右孩子权值之和 } //for } // CreatHuffmanTree void CreatHuffmanCode(HuffmanTree HT,HuffmanCode &HC,int n) { //从叶子逆向每个字符赫夫曼编码,存储在编码表HC中 int i,start,c,f; HC=new char*[n+1]; //分配n个字符编码的头指针矢量 char *cd=new char[n]; //分配临时存放编码的动态数组空间 cd[n-1]='\0'; //编码结束符 for(i=1;i<=n;++i) { //逐个字符赫夫曼编码 start=n-1; //start开始时指向最后,即编码结束符位置 c=i; f=HT[i].parent; //f指向结点c的双亲结点 while(f!=0) { //从叶子结点开始向上回溯,直到结点 --start; //回
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值