哈夫曼树及其应用

定义:

哈夫曼树(Huffman Tree)是一种特殊的二叉树,用于编码和解码数据。它是一种带有权值的树,其中权值越高的节点离根节点越近,同时具有相同进制数位的节点位于同一层。
在哈夫曼树中,每个叶子节点表示一个数据元素,每个非叶子节点表示一个由子节点加权和构成的新数据元素。具体来说,每个节点的权值等于其左子节点和右子节点的权值之和。因此,权值越高的节点离根节点越近,而且即使有多个节点的权值相同,它们也可以位于不同的层级。
哈夫曼树的基本思想是将频率高的字符用较短的编码,频率低的字符用较长的编码,从而达到有效压缩的目的。这个编码方式被称为哈夫曼编码(Huffman Coding),它是一种前缀编码方式,即任何一个字符编码不是另一个字符编码的前缀,因此可以正确地解码。
哈夫曼树的构建过程是通过重复地选取权值最小的两棵树来生成,直到只剩下一棵树为止。该过程称为哈夫曼编码的构建算法,也称为贪心算法。

抄写代码如下:

#include<stdio.h>
#include<string.h>
#include<malloc.h>
typedef struct hnode
{ float weight;
   int lchild,rchild,parent;
 }HTNode,*HuffmanTree;/*定义二叉树的存储结点*/
typedef char **HuffmanCode;
void Select(HTNode HT[],int len,int &s1,int &s2)//选出权值最小的两个结点,下标通过s1和s2传出去
{
    int i,min1=32767,min2=32767;
    for(i=1;i<=len;i++)
    {
        if(HT[i].weight<min1&&HT[i].parent==0)
        {
            s2=s1;
            min2=min1;
            min1=HT[i].weight;
            s1=i;
        }
        else if(HT[i].weight<min2&&HT[i].parent==0)
        {    min2=HT[i].weight;
            s2=i;
        }
    }
}
void CreateHuffman_tree(HuffmanTree &Ht,int n);/*建立哈夫曼树*/
void Huffman_code(HuffmanTree HT,HuffmanCode &HC,int n);/*哈夫曼树编码*/

int main()
{
    HuffmanTree HT;
    HuffmanCode HC;
    int i, n;
    scanf("%d",&n);
    CreateHuffman_tree(HT, n);/*建立哈夫曼树*/
    Huffman_code(HT,HC,n);/*哈夫曼树编码*/
    for(i=1;i<=n;i++)/*输出字符、权值及编码*/
       printf("编码是:%s\n",HC[i]);
    return 0;
}
void CreateHuffman_tree(HuffmanTree &Ht,int n){
    int m,i;
    int s1,s2;
    int add;
    if(n<=1) return;
    m = 2 * n - 1 ;
    Ht = new HTNode[m+1];
    for(i = 1; i<=m; i++){
        Ht[i].parent = 0;
        Ht[i].lchild = 0;
        Ht[i].rchild = 0;
    }
    for(i=1;i<=n;i++){
        scanf("%f",&Ht[i].weight);
    }

    for(i = n+1; i<=m; i++){
        Select(Ht,i-1,s1,s2);
        Ht[i].weight = Ht[s1].weight+Ht[s2].weight;
        Ht[s1].parent=i;Ht[s2].parent=i;
        Ht[i].lchild=s1;Ht[i].rchild=s2;
    }
}
void Huffman_code(HuffmanTree HT,HuffmanCode &HC,int n){
    int i,c,f;
    int start;
    char * cd;
    HC = new char * [n+1];
    cd = new char[n];
    cd[n-1] = '\0';
    for(i=1; i<=n; i++){
        start=n-1;
        c=i;f=HT[i].parent;
        while(f!=0){
            --start;
            if(HT[f].lchild==c){
                cd[start]='0';
            }
            else{
                cd[start]='1';
            }
            c=f;f=HT[f].parent;
        }
        HC[i]=new char[n-start];
        strcpy(HC[i],&cd[start]);
    }
    delete cd;
}

运行结果:

  学习心得:

哈夫曼树(Huffman Tree)是一种用于数据编码和压缩的二叉树结构,其主要特点如下:

最优性:哈夫曼树是一种最优前缀编码树,也就是说,使用哈夫曼编码生成的编码长度是所有编码方案中最短的。这是由哈夫曼编码算法的特性决定的。
紧凑性:哈夫曼树是一种紧凑的数据结构,任意节点的左右子树的深度相差不超过1,因此其高度不超过log2(n+1),其中n为哈夫曼树中叶子节点的个数。这种性质使得哈夫曼树在内存中的存储空间占用最小。
唯一性:对于一个给定的字符集,哈夫曼树是唯一的,也就是说,使用哈夫曼编码生成的编码方案也是唯一的。这是由哈夫曼树的构建过程决定的。
前缀性:哈夫曼编码中的任意一个编码都不是另外一个编码的前缀。这是哈夫曼编码算法的一条重要性质,保证了编码方案的唯一性和可解性。
最小二叉树:当字符集中所有字符的出现频率相同时,哈夫曼树是一棵最小二叉树,也就是说,它是所有深度相同的二叉树中最小的。
 

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
哈夫曼树是一种经典的二叉树应用,常用于数据压缩和加密解密。哈夫曼树的构建过程是通过给定的权值序列,构建一棵带权路径长度最短的二叉树。在哈夫曼树中,权值较小的节点离根节点较近,权值较大的节点离根节点较远。哈夫曼编码是一种前缀编码,即任何一个字符的编码都不是另一个字符编码的前缀,这样就可以保证在解码时不会出现歧义。 哈夫曼树的加密过程如下: 1. 统计明文中每个字符出现的频率,并按照频率从小到大排序。 2. 将每个字符及其频率构建成一个节点,形成一个森林。 3. 从森林中选取两个权值最小的节点,将它们合并成一个新节点,权值为两个节点的权值之和,将新节点插入森林中。 4. 重复步骤3,直到森林中只剩下一个节点,即哈夫曼树的根节点。 5. 对于每个字符,从根节点开始,如果该字符的编码为0,则向左子树移动,如果为1,则向右子树移动,直到到达该字符所在的叶子节点,记录下该字符的编码。 6. 将明文中的每个字符都用其对应的编码替换,得到密文。 哈夫曼树的解密过程如下: 1. 根据密文中每个字符的编码,从哈夫曼树的根节点开始,如果该字符的编码为0,则向左子树移动,如果为1,则向右子树移动,直到到达叶子节点,记录下该叶子节点对应的字符。 2. 重复步骤1,直到解密出所有的字符,得到明文。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值