C语言实现哈夫曼树

关于huffman的定义和使用场景就不说了,可以参考别人的文章

其中我这儿哈夫曼树是采用数组来存储结点,用最小二叉堆来寻找最小结点数值

基本思路如下:
一. 创建头文件Huaffman.h,定义结点结构体,定义哈夫曼树的基本操作

#ifndef _AVL_TREE_H_
#define _AVL_TREE_H_

typedef int Type;

typedef struct _HuffmanNode{
    Type key;                   // 权值
    struct _HuffmanNode *left;  // 左孩子
    struct _HuffmanNode *right; // 右孩子
    struct _HuffmanNode *parent;    // 父节点
}HuffmanNode, *HuffmanTree;

// 前序遍历"Huffman树"
void preorder_huffman(HuffmanTree tree);
// 中序遍历"Huffman树"
void inorder_huffman(HuffmanTree tree);
// 后序遍历"Huffman树"
void postorder_huffman(HuffmanTree tree);

// 创建Huffman树
HuffmanNode* create_huffman(Type arr[], int size);

// 销毁Huffman树
void destroy_huffman(HuffmanTree tree);

// 打印Huffman树
void print_huffman(HuffmanTree tree);

#endif

二. 构造minheap.c(最小二叉堆),主要实现从堆中取出最小结点,将新结点插入二叉堆并重新排序

2.1 定义二叉堆的数组和总容量和当前大小
static HuffmanNode *m_heap; // 最小堆的数组
static int m_capacity;      // 总的容量
static int m_size;          // 当前有效数据的数量
2.2 创建最小二叉堆。首先给二叉堆初始化,权值大小赋值。然后将二叉对排序,其中涉及的下沉法可以参考
[最小二叉堆](https://yq.aliyun.com/articles/3987#)
/*
 * 创建最小堆
 *
 * 参数说明:
 *     a -- 数据所在的数组
 *     size -- 数组大小
 */
void create_minheap(Type a[], int size)
{
    int i;

    // 创建最小堆所对应的数组
    m_size = size;
    m_capacity = size;
    m_heap = (HuffmanNode *)malloc(sizeof(HuffmanNode)*size);

    // 初始化数组
    for(i=0; i<size; i++)
    {
        m_heap[i].key = a[i];
        m_heap[i].parent = m_heap[i].left = m_heap[i].right = NULL;
    }

    // 从(size/2-1) --> 0逐次遍历。遍历之后,得到的数组实际上是一个最小堆。
    for (i = size / 2 - 1; i >= 0; i--)
        minheap_filterdown(i, size-1);
}
2.3下沉算法的实现,实现将最小的结点放到第一个结点位置,结点顺序按照父亲值比孩子小顺序排列
/*
 * 最小堆的向下调整算法
 *
 * 注:数组实现的堆中,第N个节点的左孩子的索引值是(2N+1),右孩子的索引是(2N+2)。
 *
 * 参数说明:
 *     start -- 被下调节点的起始位置(一般为0,表示从第1个开始)
 *     end   -- 截至范围(一般为数组中最后一个元素的索引)
 */
static void minheap_filterdown(int start, int end)
{
    int c = start;      // 当前(current)节点的位置
    int l = 2*c + 1;    // 左(left)孩子的位置
    HuffmanNode tmp = m_heap[c];    // 当前(current)节点

    while(l <= end)
    {
        // "l"是左孩子,"l+1"是右孩子
        if(l < end && m_heap[l].key > m_heap[l+1].key)
            l++;        // 左右两孩子中选择较小者,即m_heap[l+1]
        if(tmp.key <= m_heap[l].key)
            break;      //调整结束
        else
        {
            m_heap[c] = m_heap[l];
            c = l;
            l = 2*l + 1;
        }
    }
    m_heap[c] = tmp;
}
2.4 实现新结点插入二叉树操作,并且新结点会执行上浮操作,也就是新结点要和父结点比较值大小,父结点小了,那么到后面去,新结点上去,追个操作实现二叉堆的重新排序
/*
 * 最小堆的向上调整算法(从start开始向上直到0,调整堆)
 *
 * 注:数组实现的堆中,第N个节点的左孩子的索引值是(2N+1),右孩子的索引是(2N+2)。
 *
 * 参数说明:
 *     start -- 被上调节点的起始位置(一般为数组中最后一个元素的索引)
 */
static void filter_up(int start)
{
    int c = start;          // 当前节点(current)的位置
    int p = (c-1)/2;        // 父(parent)结点的位置
    HuffmanNode tmp = m_heap[c];        // 当前节点(current)

    while(c > 0)
    {
        if(m_heap[p].key <= tmp.key)
            break;
        else
        {
            m_heap[c] = m_heap[p];
            c = p;
            p = (p-1)/2;
        }
    }
    m_heap[c] = tmp;
}

/*
 * 将node插入到二叉堆中
 *
 * 返回值:
 *     0,表示成功
 *    -1,表示失败
 */
int dump_to_minheap(HuffmanNode *node)
{
    // 如果"堆"已满,则返回
    if(m_size == m_capacity)
        return -1;

    m_heap[m_size] = *node;     // 将"node的数据"全部复制到"数组末尾"
    filter_up(m_size);          // 向上调整堆
    m_size++;                   // 堆的实际容量+1

    return 0;
}
2.5 实现最小二叉堆的最小结点出堆,并且剩下的结点重新构造成新的二叉堆。思路主要是二叉堆数组首个结点复制出去,然后首结点和尾结点交换,二叉堆重新排序,此时的排序尾结点就不参与进来了,并且将尾结点删了。
/*
 * 交换两个HuffmanNode节点的全部数据
 */
static void swap_node(int i, int j)
{
    HuffmanNode tmp = m_heap[i];
    m_heap[i] = m_heap[j];
    m_heap[j] = tmp;
}

/*
 * 新建一个节点,并将最小堆中最小节点的数据复制给该节点。
 * 然后除最小节点之外的数据重新构造成最小堆。
 *
 * 返回值:
 *     失败返回NULL。
 */
HuffmanNode* dump_from_minheap()
{
    // 如果"堆"已空,则返回
    if(m_size == 0)
        return NULL;

    HuffmanNode *node;
    if((node = (HuffmanNode *)malloc(sizeof(HuffmanNode))) == NULL)
        return NULL;

    // 将"最小节点的全部数据"复制给node
    *node = m_heap[0];

    swap_node(0, m_size-1);             // 交换"最小节点"和"最后一个节点"
    minheap_filterdown(0, m_size-2);    // 将m_heap[0...m_size-2]构造成一个最小堆
    m_size--;

    return node;
}
2.6 打印二叉堆
/*
 * 打印二叉堆
 *
 * 返回值:
 *     0,表示成功
 *    -1,表示失败
 */
void minheap_print()
{
    int i;
    for (i=0; i<m_size; i++)
        printf("%d ", m_heap[i].key);
}
2.7 销毁二叉堆
// 销毁最小堆
void destroy_minheap()
{
    m_size = 0;
    m_capacity = 0;
    free(m_heap);
}

三. 实现huffman树的基本操作
3.1 创建huffman树结点

/*
 * 创建Huffman树结点。
 *
 * 参数说明:
 *     key 是键值。
 *     left 是左孩子。
 *     right 是右孩子。
 *     parent 是父节点
 */
HuffmanNode* huffman_create_node(Type key, HuffmanNode *left, HuffmanNode* right, HuffmanNode* parent)
{
    HuffmanNode* p;

    if ((p = (HuffmanNode *)malloc(sizeof(HuffmanNode))) == NULL)
        return NULL;
    p->key = key;
    p->left = left;
    p->right = right;
    p->parent = parent;

    return p;
}
3.2 创建huffman树
/*
 * 创建Huffman树
 *
 * 参数说明:
 *     a 权值数组
 *     size 数组大小
 *
 * 返回值:
 *     Huffman树的根
 */
HuffmanNode* create_huffman(Type a[], int size)
{
    int i;
    HuffmanNode *left, *right, *parent;

    // 建立数组a对应的最小堆
    create_minheap(a, size);

    for(i=0; i<size-1; i++)
    {
        left = dump_from_minheap();  // 最小节点是左孩子
        right = dump_from_minheap(); // 其次才是右孩子

        // 新建parent节点,左右孩子分别是left/right;
        // parent的大小是左右孩子之和
        parent = huffman_create_node(left->key+right->key, left, right, NULL);
        left->parent = parent;
        right->parent = parent;


        // 将parent节点数据拷贝到"最小堆"中
        if (dump_to_minheap(parent)!=0)
        {
            printf("插入失败!\n结束程序\n");
            destroy_huffman(parent);
            parent = NULL;
            break;
        }
    }

    // 销毁最小堆
    destroy_minheap();

    return parent;
}
3.3 huffman树的三种遍历
/*
 * 前序遍历"Huffman树"
 */
void preorder_huffman(HuffmanTree tree)
{
    if(tree != NULL)
    {
        printf("%d ", tree->key);
        preorder_huffman(tree->left);
        preorder_huffman(tree->right);
    }
}


/*
 * 中序遍历"Huffman树"
 */
void inorder_huffman(HuffmanTree tree)
{
    if(tree != NULL)
    {
        inorder_huffman(tree->left);
        printf("%d ", tree->key);
        inorder_huffman(tree->right);
    }
}

/*
 * 后序遍历"Huffman树"
 */
void postorder_huffman(HuffmanTree tree)
{
    if(tree != NULL)
    {
        postorder_huffman(tree->left);
        postorder_huffman(tree->right);
        printf("%d ", tree->key);
    }
}
3.4 打印huffman树
/*
 * 打印"Huffman树"
 *
 * tree       -- Huffman树的节点
 * key        -- 节点的键值
 * direction  --  0,表示该节点是根节点;
 *               -1,表示该节点是它的父结点的左孩子;
 *                1,表示该节点是它的父结点的右孩子。
 */
void huffman_print(HuffmanTree tree, Type key, int direction)
{
    if(tree != NULL)
    {
        if(direction==0)    // tree是根节点
            printf("%2d is root\n", tree->key, key);
        else                // tree是分支节点
            printf("%2d is %2d's %6s child\n", tree->key, key, direction==1?"right" : "left");

        huffman_print(tree->left, tree->key, -1);
        huffman_print(tree->right,tree->key,  1);
    }
}
void print_huffman(HuffmanTree tree)
{
    if (tree!=NULL)
        huffman_print(tree, tree->key, 0);
}
3.5 销毁huffman树
/*
 * 销毁Huffman树
 */
void destroy_huffman(HuffmanTree tree)
{
    if (tree==NULL)
        return ;

    if (tree->left != NULL)
        destroy_huffman(tree->left);
    if (tree->right != NULL)
        destroy_huffman(tree->right);

    free(tree);
}

最后:测试一下huffman树的运行

/**
 * C 语言: Huffman树
 *
 */
#include <stdio.h>
#include "huffman.h"

#define LENGTH(a) ( (sizeof(a)) / (sizeof(a[0])) )

void main()
{
    int a[]= {5,6,8,7,15};
    int i,ilen=LENGTH(a);
    HuffmanTree root=NULL;

    printf("== 添加数组: ");
    for(i=0; i<ilen; i++)
        printf("%d ", a[i]);

    // 创建数组a对应的Huffman树
    root = create_huffman(a, ilen);

    printf("\n== 前序遍历: ");
    preorder_huffman(root);

    printf("\n== 中序遍历: ");
    inorder_huffman(root);

    printf("\n== 后序遍历: ");
    postorder_huffman(root);
    printf("\n");

    printf("== 树的详细信息: \n");
    print_huffman(root);

    // 销毁二叉树
    destroy_huffman(root);
}
![运行结果](https://img-blog.csdn.net/20160317115319514)


下载地址:[github](https://github.com/zhaoxin111/huffman)
#include #include #include #include using namespace std; # define MaxN 100//初始设定的最大结点 # define MaxC 1000//最大编码长度 # define ImpossibleWeight 10000//结点不可能达到的权值 # define n 26//字符集的个 //-----------哈夫曼树的结点结构类型定义----------- typedef struct //定义哈夫曼树各结点 { int weight;//权值 int parent;//双亲结点下标 int lchild;//左孩子结点下标 int rchild;//右孩子结点下标 }HTNode,*HuffmanTree;//动态分配组存储哈夫曼树 typedef char**HuffmanCode;//动态分配组存储哈夫曼编码表 //-------全局变量-------- HuffmanTree HT; HuffmanCode HC; int *w;//权值组 //const int n=26;//字符集的个 char *info;//字符值组 int flag=0;//初始化标记 //********************************************************************** //初始化函 //函功能: 从终端读入字符集大小n , 以及n个字符和n个权值,建立哈夫曼树,并将它存于文件hfmTree中 //函: //向量HT的前n个分量表示叶子结点,最后一个分量表示根结点,各字符的编码长度不等,所以按实际长度动态分配空间 void Select(HuffmanTree t,int i,int &s1,int &s2) { //s1为最小的两个值中序号最小的那个 int j; int k=ImpossibleWeight;//k的初值为不可能达到的最大权值 for(j=1;j<=i;j++) { if(t[j].weight<k&&t[j].parent==0) {k=t[j].weight; s1=j;} } t[s1].parent=1; k=ImpossibleWeight; for(j=1;j<=i;j++) { if(t[j].weight0),构造哈夫曼树HT,并求出n个字符的哈弗曼编码HC { int i,m,c,s1,s2,start,f; HuffmanTree p; char* cd; if(num<=1) return; m=2*num-1;//m为结点,一棵有n个叶子结点的哈夫曼树共有2n-1个结点,可以存储在一个大小为2n-1的一维组中 HT=(HuffmanTree)malloc((m+1)*sizeof(HTNode));//0号单元未用 //--------初始化哈弗曼------- for(p=HT+1,i=1;iweight=*w; p->parent=0; p->lchild=0; p->rchild=0; } for(i=num+1;iweight=0; p->parent=0; p->lchild=0; p->rchild=0; } //--------建哈夫曼树------------- for(i=num+1;i<=m;i++) { Select(HT,i-1,s1,s2);//在HT[1...i-1]选择parent为0且weight最小的两个结点,其序号分别为s1和s2 HT[s1].parent=i; HT[s2].parent=i; HT[i].lchild=s1; HT[i].rchild=s2;//左孩子权值小,右孩子权值大 HT[i].weight=HT[s1].weight+HT[s2].weight; } //-------从叶子到根逆向求每个字符的哈弗曼编码-------- HC=(HuffmanCode)malloc((num+1)*sizeof(char *));//指针组:分配n个字符编码的头指针向量 cd=(char*)malloc(n*sizeof(char*));//分配求编码的工作空间 cd[n-1]='\0';//编码结束符 for(i=1;i<=n;i++)//逐个字符求哈弗曼编码 { start=n-1;//编码结束符位置 for(c=i,f=HT[i].parent;f!=0;c=f,f=HT[f].parent)//从叶子到跟逆向求哈弗曼编码 if(HT[f].lchild==c) cd[--start]='0';//判断是左孩子还是右孩子(左为0右为1) else cd[--start]='1'; HC[i]=(char*)malloc((num-start)*sizeof(char*));//按所需长度分配空间 int j,h; strcpy(HC[i],&cd[start]); } free(cd); } //****************初始化函****************** void Initialization() { flag=1;//标记为已初始化 int i; w=(int*)malloc(n*sizeof(int));//为26个字符权值分配空间 info=(char*)malloc(n*sizeof(char));//为26个字符分配空间 ifstream infile("ABC.txt",ios::in); if(!infile) { cerr<<"打开失败"<<endl; exit(1); } for(i=0;i>info[i]; infile>>w[i]; } infile.close(); cout<<"读入字符成功!"<<endl; HuffmanCoding(HT,HC,w,n); //------------打印编码----------- cout<<"依次显示各个字符的值,权值或频度,编码如下"<<endl; cout<<"字符"<<setw(6)<<"权值"<<setw(11)<<"编码"<<endl; for(i=0;i<n;i++) { cout<<setw(3)<<info[i]; cout<<setw(6)<<w[i]<<setw(12)<<HC[i+1]<<endl; } //---------将建好的哈夫曼树写入文件------------ cout<<"下面将哈夫曼树写入文件"<<endl; ofstream outfile("hfmTree.txt",ios::out); if(!outfile) { cerr<<"打开失败"<<endl; exit(1); } for(i=0;i<n;i++,w++) { outfile<<info[i]<<" "; outfile<<w[i]<<" "; outfile<<HC[i+1]<<" "; } outfile.close(); cout<<"已经将字符与对应的权值,编码写入根目录下文件hfmTree.txt"<<endl; } //*****************输入待编码字符函************************* void Input() { char string[100]; ofstream outfile("ToBeTran.txt",ios::out); if(!outfile) { cerr<<"打开失败"<<endl; exit(1); } cout<<"请输入你想要编码的字符串(字符个应小于100),以#结束"<>string; for(int i=0;string[i]!='\0';i++) { if(string[i]=='\0') break; outfile<<string[i]; } cout<<"获取报文成功"<<endl; outfile.close(); cout<<"------"<<"已经将报文存入根目录下的ToBeTran.txt文件"<<endl; } //******************编码函**************** void Encoding() { int i,j; char*string; string=(char*)malloc(MaxN*sizeof(char)); cout<<"下面对根目录下的ToBeTran.txt文件中的字符进行编码"<<endl; ifstream infile("ToBeTran.txt",ios::in); if(!infile) { cerr<<"打开失败"<<endl; exit(1); } for(i=0;i>string[i]; } for(i=0;i<100;i++) if(string[i]!='#') cout<<string[i]; else break; infile.close(); ofstream outfile("CodeFile.txt",ios::out); if(!outfile) { cerr<<"打开失败"<<endl; exit(1); } for(i=0;string[i]!='#';i++) { for(j=0;j<n;j++) { if(string[i]==info[j]) outfile<<HC[j+1]; } } outfile<<'#'; outfile.close(); free(string); cout<<"编码完成------"; cout<<"编码已写入根目录下的文件CodeFile.txt中"<<endl; } //******************译码函**************** void Decoding() { int j=0,i; char *code; code=(char*)malloc(MaxC*sizeof(char)); char*string; string=(char*)malloc(MaxN*sizeof(char)); cout<<"下面对根目录下的CodeFile.txt文件中的代码进行译码"<<endl; ifstream infile("CodeFile.txt",ios::in); if(!infile) { cerr<<"打开失败"<<endl; exit(1); } for( i=0;i>code[i]; if(code[i]!='#') { cout<<code[i]; } else break; } infile.close(); int m=2*n-1; for(i=0;code[i-1]!='#';i++) { if(HT[m].lchild==0) { string[j]=info[m-1]; j++; m=2*n-1; i--; } else if(code[i]=='1') m=HT[m].rchild; else if(code[i]=='0') m=HT[m].lchild; } string[j]='#'; ofstream outfile("TextFile.txt",ios::out); if(!outfile) { cerr<<"打开失败"<<endl; exit(1); } cout<<"的译码为------"<<endl; for( i=0;string[i]!='#';i++) { outfile<<string[i]; cout<<string[i]; } outfile<<'#'; outfile.close(); cout<<"------译码完成------"<<endl; cout<<"译码结果已写入根目录下的文件TextFile.txt中"<<endl; free(code); free(string); } //*************打印编码函**************** void Code_printing() { int i; char *code; code=(char*)malloc(MaxC*sizeof(char)); cout<<"下面打印根目录下文件CodeFile.txt中的编码"<<endl; ifstream infile("CodeFile.txt",ios::in); if(!infile) { cerr<<"打开失败"<<endl; exit(1); } for( i=0;i>code[i]; if(code[i]!='#') cout<<code[i]; else break; } infile.close(); cout<<endl; ofstream outfile("CodePrin.txt",ios::out); if(!outfile) { cerr<<"打开失败"<<endl; exit(1); } for(i=0;code[i]!='#';i++) { outfile<<code[i]; } outfile.close(); free(code); cout<<"------打印结束------"<<endl; cout<<"该字符形式的编码文件已写入文件CodePrin.txt中"<<endl; } //*************打印哈夫曼树**************** int numb=0; void coprint(HuffmanTree start,HuffmanTree HT) //start=ht+26这是一个递归算法 { if(start!=HT) { ofstream outfile("TreePrint.txt",ios::out); if(!outfile) { cerr<<"打开失败"<rchild,HT); //递归先序遍历 cout<<setw(5*numb)<weight<rchild==0) cout<<info[start-HT-1]<<endl; outfile<weight; coprint(HT+start->lchild,HT); numb--; outfile.close(); } } void Tree_printing(HuffmanTree HT,int num) { HuffmanTree p; p=HT+2*num-1; //p=HT+26 cout<<"下面打印赫夫曼"<<endl; coprint(p,HT); //p=HT+26 cout<<"打印工作结束"<<endl; } //*************主函************************** int main() { char choice; do{ cout<<"************哈弗曼编/译码器系统***************"<<endl; cout<<"请选择您所需功能:"<<endl; cout<<":初始化哈弗曼"<<endl; cout<<":输入待编码字符串"<<endl; cout<<":利用已建好的哈夫曼树进行编码"<<endl; cout<<":利用已建好的哈夫曼树进行译码"<<endl; cout<<":打印代码文件"<<endl; cout<<":打印哈夫曼树"<<endl; cout<<":退出"<<endl; if(flag==0) { cout<<"请先初始化哈夫曼树,输入I"<<endl; cout<<""<>choice; switch(choice) { case 'I':Initialization();break; case 'W':Input();break; case 'E':Encoding();break; case 'D':Decoding();break; case 'P':Code_printing();break; case 'T':Tree_printing(HT,n);break; case 'Q':;break; default:cout<<"输入的命令出错,请重新输入!"<<endl; } }while(choice!='Q'); free(w); free(info); free(HT); free(HC); system("pause"); return 0; }
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值