C语言实现数据结构之哈夫曼编码

本文详细讲解了如何利用哈夫曼树进行字符编码和解码,涉及统计、构造、编码和解码的步骤。
摘要由CSDN通过智能技术生成
任务

树的每个结点代表一个集合元素。根据给定的若干权值来构造哈夫曼树,实现对应的哈夫曼编码以及译码。

分析

哈夫曼树就是带权路径长度最小的二叉树。构造的思路是将文件中的每一个字符构造成结点对象,然后把每一个结点当成一棵树,将所有结点当成一片森林。然后每次从所有结点中取两个最小的结点,比较小的作为左子结点,比较大的作为右子结点,它们的和作为父结点构成一颗二叉树,然后把取出的这两个结点删除,将父结点放入剩下的结点中再重复以上过程直到最后只剩下一个结点,该结点即为哈夫曼树的根结点。

存储结果设计
typedef struct{
	int weight;		//权重
	char data; 		//字符
	int parent,Lchild,Rchild;
}HTNode, HuffmanTree[M+1];

int bucket[128];	//记录字符出现频率 
int count; 			//记录出现字符个个数
typedef int SeqElemtype;
typedef struct
{
	SeqElemtype data[MAXSIZE]; 
	int top; 
}SeqStack; 
//新建一个空栈
SeqStack *InitStack (){
	 
	SeqStack *S;
	S=malloc(sizeof(SeqStack));
	 
	S->top =-1; 
	return S;
}


//判断是否为空栈 
int StackEmpty (SeqStack *S){
	if(S->top==-1)
		return TRUE;
	else 
		return FALSE; 
} 

//入栈
int Push (SeqStack *S,SeqElemtype e){
	if(S->top==MAXSIZE-1) 
		return FALSE;
		
	S->top++;
	S->data[S->top]= e;
	return TRUE;
} 

//出栈并返回 
int Pop (SeqStack *S,SeqElemtype *e){
	if(S->top == -1) 
		return FALSE;
		
	*e=S->data[S->top];
	S->top--;	
	return TRUE;
	
}
源代码
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#define N 54
#define M 2*N-1
#define IO "sourceFile.txt"
#define Code "CodeFile"
#define Decode "DecodeFile"
#define MAXSIZE M*6
#define TRUE 1
#define FALSE 0 
typedef struct{
	int weight;		//权重
	char data; 		//字符
	int parent,Lchild,Rchild;
}HTNode, HuffmanTree[M+1];

int bucket[128];	//记录字符出现频率 
int count; 			//记录出现字符个个数
typedef int SeqElemtype;
typedef struct
{
	SeqElemtype data[MAXSIZE]; 
	int top; 
}SeqStack; 
//新建一个空栈
SeqStack *InitStack (){
	 
	SeqStack *S;
	S=malloc(sizeof(SeqStack));
	 
	S->top =-1; 
	return S;
}


//判断是否为空栈 
int StackEmpty (SeqStack *S){
	if(S->top==-1)
		return TRUE;
	else 
		return FALSE; 
} 

//入栈
int Push (SeqStack *S,SeqElemtype e){
	if(S->top==MAXSIZE-1) 
		return FALSE;
		
	S->top++;
	S->data[S->top]= e;
	return TRUE;
} 

//出栈并返回 
int Pop (SeqStack *S,SeqElemtype *e){
	if(S->top == -1) 
		return FALSE;
		
	*e=S->data[S->top];
	S->top--;	
	return TRUE;
	
} 
/*统计各字符权重*/
void statistics(char *sourcefile){
	count = 0; 		//计数清零
	FILE *fp;
	char ch;
	fp = fopen(sourcefile,"r"); 
	if(fp==NULL)
    {
        printf("文件打开失败\n");
        exit(0);
    }
    while((ch=fgetc(fp))!=EOF){
    	bucket[ch]++;				//字符ASCII码作为下标
    }
    int i; 
    //printf("文章字符出现情况如下:\n"); 
    for(i=0;i<128;i++){
    	if(bucket[i]){
    		count++;
    		/*if(i==10){
		    	printf("%d,回车 -->%d\n",i,bucket[i]);
		    }else if(i==13){
    			printf("%d,换行 -->%d\n",i,bucket[i]);
    		}else{
		    	printf("%d,%c -->%d\n",i,i,bucket[i]);
		    }*/
	    	
	    } 	
    } 
    fclose(fp);
}
void seek(HuffmanTree ht,int n,int *s1,int *s2){	//寻找ht中i之前最小的两个元素下标,s1<s2; 
	int i,j;
	for(i=0;i<n&&ht[i].parent!=-1;i++); //s1,s2的初始化(不存在双亲结点)
	j=i;
	i++;
	for(;i<n&&ht[i].parent!=-1;i++);	
	*s1 = ht[i].weight<ht[j].weight?i:j;
	*s2 = ht[i].weight<ht[j].weight?j:i;
	i++;
	while(i<n){
		if(ht[i].parent!=-1){			//已有双亲,则继续查找
			
		}else if(ht[i].weight<ht[*s1].weight){		//小于s1,则替换最小值,s1替换s2
			*s2 = *s1;
			*s1 = i;
		}else if(ht[i].weight<ht[*s2].weight){		//仅小于s2,则仅替换s2
			*s2 = i;
		}
		i++; 
	}
}
void CrtHuffmanTree(HuffmanTree ht){ //创建 
	int m=2*count-1;
	int i,j;
	int s1,s2;
	for(i=0,j=0;i<128;i++){				//给初始结点(储存字符)初始化
		if(bucket[i]){
			ht[j].weight=bucket[i];
			ht[j].data=i;
			ht[j].parent=-1;
			ht[j].Lchild=-1;
			ht[j].Rchild=-1;
			j++;
		}
	} 
	
	for(;j<m;j++){						//给后续双亲结点初始化
		ht[j].weight=0;
		ht[j].parent=-1;
		ht[j].Lchild=-1;
		ht[j].Rchild=-1; 
	}	
	for(j=count;j<m;j++)
	{
		seek(ht,j,&s1,&s2);	 //寻找ht中i之前最小的两个元素下标,s1<s2; 
		ht[s1].parent=j;
		ht[s2].parent=j;
		ht[j].weight = ht[s1].weight+ht[s2].weight;
		ht[j].Lchild = s1;
		ht[j].Rchild = s2;
	}
	
	/*for(i=0;i<m;i++){
		printf("%c %d %d %d %d\n",ht[i].data,ht[i].weight,ht[i].parent,ht[i].Lchild,ht[i].Rchild);
	}*/
}
void Codinghuffman(HuffmanTree	ht , char *myfile, char *codefile){ //编码 
	FILE *infp,*outfp;
	infp = fopen(myfile,"r"); 
	if(infp==NULL)
    {
        printf("文件打开失败\n");
        exit(0);
    }
    
	outfp = fopen(codefile,"wb"); 
	if(outfp==NULL)
    {
        printf("文件打开失败\n");
        exit(0);
    }
	 
 
 	int i,j;
	int p,q;
	int str1[200];
	char ch; 
 	while((ch=fgetc(infp))!=EOF){
    	for(p=0;ht[p].data!=ch&&p<count;p++); //找到该元素在哈夫曼树中的位置 
    	
    	
    	for(j=0;ht[p].parent!=-1;j++){     
			
			q=ht[p].parent;
			if(p==ht[q].Lchild){
				str1[j]='0';
			}else{
				str1[j]='1';
			}
			p=ht[p].parent;
		}
		
		for(j=j-1;j>=0;j--){
			fputc(str1[j],outfp);
		}
    }
	fclose(infp);
	fclose(outfp);			 
}
void DecodeHuffmanTree(HuffmanTree ht, char *codefile, char*decodefile){  //解码 

	FILE *infp,*outfp;
	infp = fopen(codefile,"rb"); 
	if(infp==NULL)
    {
        printf("文件打开失败\n");
        exit(0);
    }
	outfp = fopen(decodefile,"w"); 
	if(outfp==NULL)
    {
        printf("文件打开失败\n");
        exit(0);
    }
	
	int i,j;
	int p=2*count-2; // p当前节点
	char ch;
	while((ch=fgetc(infp))!=EOF){
		if(ch=='1'){
			p = ht[p].Rchild;
		}else if(ch=='0'){
			p = ht[p].Lchild;
		}
		if(ht[p].Lchild==-1&&ht[p].Rchild==-1){  //当前字段解码完毕 
			printf("%c",ht[p].data);
			fputc(ht[p].data,outfp);
			p =2*count-2; 
		}
	} 
	fclose(infp);
	fclose(outfp);
}
void OutHuffmanTree(HuffmanTree ht){
	int p,q;
	SeqStack *S;
	S = InitStack();
	p = 2*count-2;
	int count,i;
	while(p!=-1||StackEmpty(S)==0){
		
		while(p!=-1){   
			Push(S,p); //入栈 
			p=ht[p].Lchild; //遍历左子树 

		} 
		if(StackEmpty(S)==0){
			Pop(S,&p);//出栈 
			count=0;
			q=p;
			while(q!=-1){
				q=ht[q].parent;
				count++;
			}
			for(i=1;i<count;i++){
				printf("    ");
			}
			printf("%-4d\n",ht[p].weight);
			p=ht[p].Rchild; //遍历左子树 		
		} 
		
	} 
}

void PrintCode(HuffmanTree	ht){ //编码所有的叶子节点 
	int i,j;
	char str[N];
	int p,q; //p当前节点,q是p的双亲节点 
	for(i=0;i<count;i++){
		p=i;
		for(j=0;ht[p].parent!=-1;j++){     
			
			q=ht[p].parent;
			if(p==ht[q].Lchild){ //如果是左节点,则为0 
				str[j]='0';
			}else{           //如果是右节点,则为1 
				str[j]='1';
			}
			p=ht[p].parent;
		}
		
		printf("%c: ",ht[i].data); //打印结果 
		for(j=j-1;j>=0;j--){
			printf("%c",str[j],j);
		}
		printf("\n");
	}
} 

int main(){
	char myfile[20], codefile[20], decodefile[20];
	int code;
	HuffmanTree ht[M+1];
	printf("--------------------哈夫曼树基本操作系统--------------\n");
	printf(" | 1.建立并输出哈夫曼树                              |\n");
	printf("------------------------------------------------------\n");
	printf(" | 2.建立并输出哈夫曼编码                            |\n");
	printf("------------------------------------------------------\n");
	printf(" | 3.将文本转换成01编码                              |\n");
	printf("------------------------------------------------------\n");
	printf(" | 4.将01编码翻译成文本                              |\n"); 
	printf("------------------------------------------------------\n");
	printf(" | 0.退出系统                                        |\n");
	printf("------------------------------------------------------\n");
	for(;;){
		printf("\n请选择操作:");
		scanf("%d", &code);
		fflush(stdin);
		switch(code){
			case 1: 
					printf("请输入需要编码的文件名(包含拓展名):");
					scanf("%s", myfile);
					statistics(myfile);
					CrtHuffmanTree(ht);    						//创建哈夫曼树
					printf("哈夫曼树创建成功!\n");
					printf("哈夫曼树如下:");
					OutHuffmanTree(ht);  
					break;
			case 2:	printf("请输入需要编码的文件名(包含拓展名):");
					scanf("%s", myfile);
					statistics(myfile);
					CrtHuffmanTree(ht);  
					printf("哈夫曼编码创建成功!");
					printf("哈夫曼编码如下:");
					PrintCode(ht);
					break;
			case 3: printf("请输入编码目标文件名(包含拓展名):");
					scanf("%s", codefile);
					Codinghuffman(ht, myfile, codefile); 		//对文件进行编码
					printf("编码成功!\n");
				    break;
			case 4: printf("请输入解码目标的文件名(包含拓展名):");
					scanf("%s", decodefile);
					DecodeHuffmanTree(ht, codefile, decodefile);		
					printf("解码成功!\n");
					break;
			case 0: printf("谢谢使用!\n");
					return 0;
			default: printf("暂时不支持该功能!\n");
					break;
		}
	}
	
}
运行结果

  • 6
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
#include #include #include #include using namespace std; # define MaxN 100//初始设定的最大结点数 # define MaxC 1000//最大编码长度 # define ImpossibleWeight 10000//结点不可能达到的权值 # define n 26//字符集的个数 //-----------哈夫曼树的结点结构类型定义----------- typedef struct //定义哈夫曼树各结点 { int weight;//权值 int parent;//双亲结点下标 int lchild;//左孩子结点下标 int rchild;//右孩子结点下标 }HTNode,*HuffmanTree;//动态分配数组存储哈夫曼树 typedef char**HuffmanCode;//动态分配数组存储哈夫曼编码表 //-------全局变量-------- HuffmanTree HT; HuffmanCode HC; int *w;//权值数组 //const int n=26;//字符集的个数 char *info;//字符值数组 int flag=0;//初始化标记 //********************************************************************** //初始化函数 //函数功能: 从终端读入字符集大小n , 以及n个字符和n个权值,建立哈夫曼树,并将它存于文件hfmTree中 //函数参数: //向量HT的前n个分量表示叶子结点,最后一个分量表示根结点,各字符的编码长度不等,所以按实际长度动态分配空间 void Select(HuffmanTree t,int i,int &s1,int &s2) { //s1为最小的两个值中序号最小的那个 int j; int k=ImpossibleWeight;//k的初值为不可能达到的最大权值 for(j=1;j<=i;j++) { if(t[j].weight<k&&t[j].parent==0) {k=t[j].weight; s1=j;} } t[s1].parent=1; k=ImpossibleWeight; for(j=1;j<=i;j++) { if(t[j].weight0),构造哈夫曼树HT,并求出n个字符的哈弗曼编码HC { int i,m,c,s1,s2,start,f; HuffmanTree p; char* cd; if(num<=1) return; m=2*num-1;//m为结点数,一棵有n个叶子结点的哈夫曼树共有2n-1个结点,可以存储在一个大小为2n-1的一维数组中 HT=(HuffmanTree)malloc((m+1)*sizeof(HTNode));//0号单元未用 //--------初始化哈弗曼树------- for(p=HT+1,i=1;iweight=*w; p->parent=0; p->lchild=0; p->rchild=0; } for(i=num+1;iweight=0; p->parent=0; p->lchild=0; p->rchild=0; } //--------建哈夫曼树------------- for(i=num+1;i<=m;i++) { Select(HT,i-1,s1,s2);//在HT[1...i-1]选择parent为0且weight最小的两个结点,其序号分别为s1和s2 HT[s1].parent=i; HT[s2].parent=i; HT[i].lchild=s1; HT[i].rchild=s2;//左孩子权值小,右孩子权值大 HT[i].weight=HT[s1].weight+HT[s2].weight; } //-------从叶子到根逆向求每个字符的哈弗曼编码-------- HC=(HuffmanCode)malloc((num+1)*sizeof(char *));//指针数组:分配n个字符编码的头指针向量 cd=(char*)malloc(n*sizeof(char*));//分配求编码的工作空间 cd[n-1]='\0';//编码结束符 for(i=1;i<=n;i++)//逐个字符求哈弗曼编码 { start=n-1;//编码结束符位置 for(c=i,f=HT[i].parent;f!=0;c=f,f=HT[f].parent)//从叶子到跟逆向求哈弗曼编码 if(HT[f].lchild==c) cd[--start]='0';//判断是左孩子还是右孩子(左为0右为1) else cd[--start]='1'; HC[i]=(char*)malloc((num-start)*sizeof(char*));//按所需长度分配空间 int j,h; strcpy(HC[i],&cd[start]); } free(cd); } //****************初始化函数****************** void Initialization() { flag=1;//标记为已初始化 int i; w=(int*)malloc(n*sizeof(int));//为26个字符权值分配空间 info=(char*)malloc(n*sizeof(char));//为26个字符分配空间 ifstream infile("ABC.txt",ios::in); if(!infile) { cerr<<"打开失败"<<endl; exit(1); } for(i=0;i>info[i]; infile>>w[i]; } infile.close(); cout<<"读入字符成功!"<<endl; HuffmanCoding(HT,HC,w,n); //------------打印编码----------- cout<<"依次显示各个字符的值,权值或频度,编码如下"<<endl; cout<<"字符"<<setw(6)<<"权值"<<setw(11)<<"编码"<<endl; for(i=0;i<n;i++) { cout<<setw(3)<<info[i]; cout<<setw(6)<<w[i]<<setw(12)<<HC[i+1]<<endl; } //---------将建好的哈夫曼树写入文件------------ cout<<"下面将哈夫曼树写入文件"<<endl; ofstream outfile("hfmTree.txt",ios::out); if(!outfile) { cerr<<"打开失败"<<endl; exit(1); } for(i=0;i<n;i++,w++) { outfile<<info[i]<<" "; outfile<<w[i]<<" "; outfile<<HC[i+1]<<" "; } outfile.close(); cout<<"已经将字符与对应的权值,编码写入根目录下文件hfmTree.txt"<<endl; } //*****************输入待编码字符函数************************* void Input() { char string[100]; ofstream outfile("ToBeTran.txt",ios::out); if(!outfile) { cerr<<"打开失败"<<endl; exit(1); } cout<<"请输入你想要编码的字符串(字符个数应小于100),以#结束"<>string; for(int i=0;string[i]!='\0';i++) { if(string[i]=='\0') break; outfile<<string[i]; } cout<<"获取报文成功"<<endl; outfile.close(); cout<<"------"<<"已经将报文存入根目录下的ToBeTran.txt文件"<<endl; } //******************编码函数**************** void Encoding() { int i,j; char*string; string=(char*)malloc(MaxN*sizeof(char)); cout<<"下面对根目录下的ToBeTran.txt文件中的字符进行编码"<<endl; ifstream infile("ToBeTran.txt",ios::in); if(!infile) { cerr<<"打开失败"<<endl; exit(1); } for(i=0;i>string[i]; } for(i=0;i<100;i++) if(string[i]!='#') cout<<string[i]; else break; infile.close(); ofstream outfile("CodeFile.txt",ios::out); if(!outfile) { cerr<<"打开失败"<<endl; exit(1); } for(i=0;string[i]!='#';i++) { for(j=0;j<n;j++) { if(string[i]==info[j]) outfile<<HC[j+1]; } } outfile<<'#'; outfile.close(); free(string); cout<<"编码完成------"; cout<<"编码已写入根目录下的文件CodeFile.txt中"<<endl; } //******************译码函数**************** void Decoding() { int j=0,i; char *code; code=(char*)malloc(MaxC*sizeof(char)); char*string; string=(char*)malloc(MaxN*sizeof(char)); cout<<"下面对根目录下的CodeFile.txt文件中的代码进行译码"<<endl; ifstream infile("CodeFile.txt",ios::in); if(!infile) { cerr<<"打开失败"<<endl; exit(1); } for( i=0;i>code[i]; if(code[i]!='#') { cout<<code[i]; } else break; } infile.close(); int m=2*n-1; for(i=0;code[i-1]!='#';i++) { if(HT[m].lchild==0) { string[j]=info[m-1]; j++; m=2*n-1; i--; } else if(code[i]=='1') m=HT[m].rchild; else if(code[i]=='0') m=HT[m].lchild; } string[j]='#'; ofstream outfile("TextFile.txt",ios::out); if(!outfile) { cerr<<"打开失败"<<endl; exit(1); } cout<<"的译码为------"<<endl; for( i=0;string[i]!='#';i++) { outfile<<string[i]; cout<<string[i]; } outfile<<'#'; outfile.close(); cout<<"------译码完成------"<<endl; cout<<"译码结果已写入根目录下的文件TextFile.txt中"<<endl; free(code); free(string); } //*************打印编码函数**************** void Code_printing() { int i; char *code; code=(char*)malloc(MaxC*sizeof(char)); cout<<"下面打印根目录下文件CodeFile.txt中的编码"<<endl; ifstream infile("CodeFile.txt",ios::in); if(!infile) { cerr<<"打开失败"<<endl; exit(1); } for( i=0;i>code[i]; if(code[i]!='#') cout<<code[i]; else break; } infile.close(); cout<<endl; ofstream outfile("CodePrin.txt",ios::out); if(!outfile) { cerr<<"打开失败"<<endl; exit(1); } for(i=0;code[i]!='#';i++) { outfile<<code[i]; } outfile.close(); free(code); cout<<"------打印结束------"<<endl; cout<<"该字符形式的编码文件已写入文件CodePrin.txt中"<<endl; } //*************打印哈夫曼树函数**************** int numb=0; void coprint(HuffmanTree start,HuffmanTree HT) //start=ht+26这是一个递归算法 { if(start!=HT) { ofstream outfile("TreePrint.txt",ios::out); if(!outfile) { cerr<<"打开失败"<rchild,HT); //递归先序遍历 cout<<setw(5*numb)<weight<rchild==0) cout<<info[start-HT-1]<<endl; outfile<weight; coprint(HT+start->lchild,HT); numb--; outfile.close(); } } void Tree_printing(HuffmanTree HT,int num) { HuffmanTree p; p=HT+2*num-1; //p=HT+26 cout<<"下面打印赫夫曼树"<<endl; coprint(p,HT); //p=HT+26 cout<<"打印工作结束"<<endl; } //*************主函数************************** int main() { char choice; do{ cout<<"************哈弗曼编/译码器系统***************"<<endl; cout<<"请选择您所需功能:"<<endl; cout<<":初始化哈弗曼树"<<endl; cout<<":输入待编码字符串"<<endl; cout<<":利用已建好的哈夫曼树进行编码"<<endl; cout<<":利用已建好的哈夫曼树进行译码"<<endl; cout<<":打印代码文件"<<endl; cout<<":打印哈夫曼树"<<endl; cout<<":退出"<<endl; if(flag==0) { cout<<"请先初始化哈夫曼树,输入I"<<endl; cout<<""<>choice; switch(choice) { case 'I':Initialization();break; case 'W':Input();break; case 'E':Encoding();break; case 'D':Decoding();break; case 'P':Code_printing();break; case 'T':Tree_printing(HT,n);break; case 'Q':;break; default:cout<<"输入的命令出错,请重新输入!"<<endl; } }while(choice!='Q'); free(w); free(info); free(HT); free(HC); system("pause"); return 0; }

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值