C/C++数据结构之哈夫曼树编译码问题(代码直接使用)
前言
利用哈夫曼编码进行通讯可以大大提高信道利用率,缩短信息传输时间,降低 传输成本。但是,这要求在发送端通过一个编码系统将待传数据进行预先编码;在接受端将传来的数据进行解码(复原)。对于可以双向传输的信道,每端都要有一个完整的编/译码系统。
问题重述
(一) 从终端读入字符集大小为n(即字符的个数),逐一输入n个字符和相应的 n个权值(即字符出现的频度),建立哈夫曼树,将它存于文件 hfmtree 中。对每个字符进行编码并且输出。对已编码的正文进行译码,输出译码后的正文。
(二) 采用文本文件存放文本,先统计文本中的每个字符出现的频率,然后再建立哈夫曼树,并进行编码和译码。
程序功能
程序分为两块。
第一块对应问题的第一项,由用户输入n对字符和权值,之后进行编码,译码和输出。
第二块对应问题的第二项,程序将读取文件,并计算权值。此时程序所在目录下应有“CharactersWeights.txt”文件,存有等待传输的明文。
代码如下:
#include <stdio.h>
#include <malloc.h>
#include <string.h>
//定义结构体
typedef struct {
char info;
int weight;
int parent, lchild, rchild;
} HTNode, *HuffmanTree;
typedef char* *HuffmanCode;
HuffmanTree HT;
HuffmanCode HC;
int n; //n为全局变量,表示字符与权值的对数
int n2; //n2为全局变量,用于表示结点数
void CodeToText();
//编码
void TextToCode(char str[]) {
int i, j, p , ju;
printf("编码结果如下:\n");
p = strlen(str);
for (i = 1; i <=p; i++)
for (j = 1; j <= n; j++)
{
if (str[i-1] == HT[j].info)
{
printf("%s", HC[j]);
break;
}
}
printf("\n");
printf("是否译码?(1为是,0为否)\n");
scanf("%d",&ju);
if(ju==1)
CodeToText(); //调用译码函数
}
// 译码函数
void CodeToText() {
int i = 1, j, key;
int i1, i2;
char str[1000]; //定义足够大的字符数组
int a = 1;
int m = 2 * n - 1;
if (HT == NULL)
{
printf("请先进行初始化!\n");
return ;
}
printf("\n每个字母对应的哈夫曼编码:\n");
for(;a<n+1;a++)
printf(" %c:%-11s ", HT[a].info, HC[a]);
printf("\n请输入哈夫曼编码:\n");
scanf("%s", str);
j = strlen(str);
key = m;
printf("哈夫曼编码译码如下:\n");
while (i <= j)
{
while (HT[key].lchild != 0)
{
if (str[i-1] == '0')
{key = HT[key].lchild;
i++; continue;
}
if (str[i-1] == '1') {key = HT[key].rchild;
i++; continue;
}
}
printf("%c", HT[key].info);
key = m;
}
printf("\n");
}
//在 HT[1...t] 中选择 parent 不为 0 且权值最小的两个结点,其序号分别为 s1 和 s2
void Select(HuffmanTree HT, int t, int *s1, int *s2) {
int i, temp1, temp2;
temp1 = temp2 = 1000;
for (i = 1; i <= t; i++)
if (HT[i].parent == 0 && (HT[i].weight < temp1 || HT[i].weight < temp2))
if (temp1 < temp2)
{temp2 = HT[i].weight;
*s1 = i;
}
else {temp1 = HT[i].weight;
*s2 = i;
}
// s1 放较小的序号
if (*s1 > *s2)
{
i = *s1; *s1 = *s2; *s2 = i;
}
}
HuffmanTree HuffmanCoding(int *w, int n, char *info)
{
HuffmanTree HT, p;
char *cd;
int m, s1, s2, i, start, f, c;
if (n <= 1)
return 0;
m = 2 * n - 1;
HT = (HuffmanTree)malloc((m+1)*sizeof(HTNode));
p = HT + 1;
for (i = 1; i <= n; ++i, ++p, ++w)
{
// 序号从1开始
p->weight = *w;
p->info = info[i-1];
p->parent = 0; p->lchild = 0; p->rchild = 0;
}
for (; i <= m; ++i, ++p)
{
p->weight = 0; p->parent = 0; p->lchild = 0; p->rchild = 0;
}
for (i = n+1; i <= m; ++i)
{
// 在 HT 中选择 parent 为 0 且 weight 最小的两个结点,其序号分别为 s1, s2
Select(HT, i-1, &s1, &s2);
HT[s1].parent = i;
HT[s2].parent = i;
HT[i].lchild = s1;
HT[i].rchild = s2;
HT[i].weight = HT[s1].weight + HT[s2].weight;
}
//求哈夫曼编码
HC = (HuffmanCode)malloc((n+1)*sizeof(char *));
cd = (char *)malloc(n*sizeof(char));
cd[n-1] = '\0';
for (i = 1; i <= n; ++i)
{
start = n - 1;
for (c = i, f = HT[i].parent; f != 0; c = f, f = HT[f].parent) // 从子叶到根逆向2求编码 f 为父结点 c 为子结点
{
if (HT[f].lchild == c)
cd[--start] = '0';
else
cd[--start] = '1';
}
HC[i] = (char *)malloc((n-start)*sizeof(char));
strcpy(HC[i], &cd[start]);
}
free(cd);
return HT;
}
HuffmanTree Count_char()
{
int chara[26] = {0},fing[10] = {0};
int tip = 0;
char c;
int i,j,w[37]; //数组存放字符的权值
char character[37]; //存放n个字符
FILE *fp;
FILE * p ;
p = fopen("test.txt","a+");
if (p != NULL)
{
printf("以下为读出的内容\n");
do //这里先进入循环,读取c,然后在判断条件
{
c = fgetc(p);
printf("%c",c);
if (c >= 'a'&& c <= 'z')
chara[(c-'a')]++;
else if (c >= 'A' && c <= 'Z')
chara[(c-'A')]++;
else if (c >= '0' && c <= '9')
fing[(c-'0')]++;
else
tip++;
}while (c != feof(p) && c != EOF);
fclose(p);
}
j = 0;i = 0;
while(i<26)
{
if(chara[i]!=0) //把字母权重存进统一数组
{
character[j] = 'A' + i;
w[j] = chara[i];
j++;
}
i++;
}
i = 0;
while(i<10)
{
if(fing[i]!=0) //把数字权重存进统一数组
{
character[j] = '0'+i;
w[j] = fing[i];
j++;
}
i++;
}
if(tip!=0) //把空格权重存进统一数组
{character[j]=' ';
w[j] = tip;
}
n = j+1;
HT = HuffmanCoding(w,n,character); //建立赫夫曼树
if((fp=fopen("hfmtree.txt","w"))==NULL)
printf("打开文件失败!\n");
for (i=1;i<=2*n-1;i++)
{
if(fwrite(&HT[i],sizeof(HTNode),1,fp)!=1) //将建立的赫夫曼树存入文件hfmtree.txt中
printf("写入失败!\n");
}
printf("\n赫夫曼树建立成功,并已存于文件hfmtree.txt中\n");
fclose(fp);
return(HT);
}
//初始化函数,输入n个字符及其对应的权值,根据权值建立哈夫曼树,并将其存于文件hfmtree中
HuffmanTree Init()
{
FILE *fp;
int i,w[37]; //数组存放字符的权值
char character[37]; //存放n个字符
printf("输入字符个数 n:");
scanf("%d",&n); //输入字符集大小
printf("输入%d个字符及其对应的权值:\n",n);
for (i=0;i<n;i++)
{
char b=getchar();
scanf("%c",&character[i]);
scanf("%d",&w[i]); //输入n个字符和对应的权值
}
HT = HuffmanCoding(w,n,character); //建立赫夫曼树
if((fp=fopen("hfmtree.txt","w"))==NULL)
printf("打开文件失败!\n");
for (i=1;i<=2*n-1;i++)
{
if(fwrite(&HT[i],sizeof(HTNode),1,fp)!=1) //将建立的赫夫曼树存入文件hfmtree.txt中
printf("写入失败!\n");
}
printf("\n赫夫曼树建立成功,并已存于文件hfmtree.txt中\n");
fclose(fp);
return(HT);
}
int main()
{
int i, j = 1;
char select;
char str[1000] = {0};
printf("1 输入字符及权重进行初始化建立哈夫曼树\n");
printf("2 直接读取文件进行初始化建立哈夫曼树\n");
printf(" 请选择操作(输入1或2):\n");
scanf("%d", &i);
if(i==1)
{
HT = Init();
printf("请输入要编码的文本:\n");
getchar();
gets(str);
TextToCode(str);
printf("哈夫曼树输出如下:\n");
}
else if(i==2)
{
HT = Count_char();
i = 0;
FILE *fp1;//文件指针
//选择第二类编码译码时,程序所在文件夹下应有 CharactersWeights.txt文件,文件内存有等待传输的明文
fp1 = fopen("CharactersWeights.txt", "r");//以文本方式打开文件。
while(fscanf(fp1, "%c", &str[i]) != EOF) //读取数据到数组,直到文件结尾(返回EOF)
i++;
fclose(fp1);//关闭文件
TextToCode(str);
}
else
printf("请输入1或者2!\n");
return 0;
}
运行结果截图:
新人写博客,难免存在疏漏之处,欢迎各位朋友批评指正!
参考博客链接:
https://blog.csdn.net/laugh12321/article/details/83758621?ops_request_misc=%25257B%252522request%25255Fid%252522%25253A%252522160906786316780273360664%252522%25252C%252522scm%252522%25253A%25252220140713.130102334…%252522%25257D&request_id=160906786316780273360664&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2allbaidu_landing_v2~default-6-83758621.nonecase&utm_term=%E5%93%88%E5%A4%AB%E6%9B%BC%E6%A0%91%E7%BC%96%E7%A0%81%E8%AF%91%E7%A0%81