实验五:二叉树的应用—Huffman编码与译码
实验目的:熟练掌握二叉树的基本操作操作,应用二叉树的结构解决实际问题,熟练掌握Huffman树和Huffman编码的构造方法。
实验内容:设计实现Huffman树的创建算法,并利用Huffman树进行编码和译码。
要求:1.在“Huffman编码“基础上的实现译码操作如输入“10010”译出相应的字符。 2.选做:(1)增加统计原文中各字符权值的功能,(2)将原文进行编码。
代码阅读:表达式树的创建与求值。
//算法5.11 根据赫夫曼树求赫夫曼编码
#include<iostream>
#include<cstring>
using namespace std;
typedef struct
{
int weight;
int parent,lchild,rchild;
}HTNode,*HuffmanTree;
typedef char **HuffmanCode;
void Select(HuffmanTree HT,int len,int &s1,int &s2)
{
int i,min1=INT_MAX,min2=INT_MAX;//先赋予最大值
for(i=1;i<=len;i++)
{
if(HT[i].weight<min1&&HT[i].parent==0)
{
min1=HT[i].weight;
s1=i;
}
}
int temp=HT[s1].weight;//将原值存放起来,然后先赋予最大值,防止s1被重复选择
HT[s1].weight=INT_MAX;
for(i=1;i<=len;i++)
{
if(HT[i].weight<min2&&HT[i].parent==0)
{
min2=HT[i].weight;
s2=i;
}
}
HT[s1].weight=temp;//恢复原来的值
}
//用算法5.10构造赫夫曼树
void CreatHuffmanTree(HuffmanTree &HT,int n)
{
//构造赫夫曼树HT
int m,s1,s2,i;
if(n<=1) return;
m=2*n-1;//一棵有n个叶子结点的哈夫曼树共有2n-1个结点
HT=new HTNode[m+1]; //0号单元未用,所以需要动态分配m+1个单元,HT[m]表示根结点
for(i=1;i<=m;++i) //将1~m号单元中的双亲、左孩子,右孩子的下标都初始化为0
{ HT[i].parent=0; HT[i].lchild=0; HT[i].rchild=0; }
cout<<"请输入叶子结点的权值:\n";
for(i=1;i<=n;++i) //输入前n个单元中叶子结点的权值
cin>>HT[i].weight;
/*――――――――――初始化工作结束,下面开始创建赫夫曼树――――――――――*/
for(i=n+1;i<=m;++i)
{ //通过n-1次的选择、删除、合并来创建赫夫曼树
Select(HT,i-1,s1,s2);
//在HT[k](1≤k≤i-1)中选择两个其##双亲域为0且权值最小##的结点,
// 并返回它们在HT中的序号s1和s2
HT[s1].parent=i;
HT[s2].parent=i;
//得到新结点i,从森林中删除s1,s2,将s1和s2的双亲域由0改为i
HT[i].lchild=s1;
HT[i].rchild=s2 ; //s1,s2分别作为i的左右孩子
HT[i].weight=HT[s1].weight+HT[s2].weight; //i 的权值为左右孩子权值之和
} //for
}
// CreatHuffmanTree
void CreatHuffmanCode(HuffmanTree HT,HuffmanCode &HC,int n)
{
//从叶子到根逆向求每个字符的赫夫曼编码,存储在编码表HC中
int i,start,c,f;
HC=new char*[n+1]; //分配n个字符编码的头指针矢量
char *cd=new char[n]; //分配临时存放编码的动态数组空间
cd[n-1]='\0'; //编码结束符
for(i=1;i<=n;++i)
{ //逐个字符求赫夫曼编码
start=n-1; //start开始时指向最后,即编码结束符位置
c=i;
f=HT[i].parent; //f指向结点c的双亲结点
while(f!=0)
{ //从叶子结点开始向上回溯,直到根结点
--start; //回溯一次start向前指一个位置
if(HT[f].lchild==c)
cd[start]='0'; //结点c是f的左孩子,则生成代码0
else
cd[start]='1'; //结点c是f的右孩子,则生成代码1
c=f;
f=HT[f].parent; //继续向上回溯
} //求出第i个字符的编码
HC[i]=new char[n-start]; // 为第i 个字符编码分配空间
strcpy(HC[i], &cd[start]); //将求得的编码从临时空间cd复制到HC的当前行中
}
delete cd; //释放临时空间
} // CreatHuffanCode
void show(HuffmanTree HT,HuffmanCode HC,int n)
{
for(int i=1;i<=n;i++)
cout<<HT[i].weight<<"编码为"<<HC[i]<<endl;
}
void decode(HuffmanTree &HT,char *ch,int n)//依次读入电文,根据哈夫曼树译码
{
int i,j=0;
char b[100];
char endflag='#'; //电文结束标志取#
i=2*n-1; //从根结点开始往下搜索
getchar();
cout<<("输入发送的编码(以'#'为结束标志):");
gets(b);
cout<<"译码后的字符为";
while(b[j] != endflag)
{
//填写完整
if (ch=='\0')
{
i=HT[i].lchild;
}
else
{
i=HT[i].rchild;
}
if(HT[i].lchild==0) /*tree[i] 是叶子结点*/
{
printf("%c",HT[i].parent);
i=2*n-1;
}
scanf("%c",&ch);
}
if ((HT[i].lchild!=0)&&(i!=2*n-1)) //电文读完但没到叶子结点
printf("\n未能完全解码\n");
printf("\n");
cout<<endl;
}//decode
int main()
{
HuffmanTree HT;
HuffmanCode HC;
int n,i,c,f;
cout<<"请输入待编码的字符(叶子结点)的个数:\n";
cin>>n;
getchar();
char *p=new char[n];//?
printf("请输入待编码的字符(中间不加空格)");
for(int i=1;i<=n;i++)
cin>>p[i];
CreatHuffmanTree(HT,n);
CreatHuffmanCode(HT,HC,n);
show(HT,HC,n);
//decode(HT,p,n);
printf("【输出每个字符的哈夫曼编码】\n");
for(i=0;i<n;i++) //读入前n个结点的字符及权值
{
printf("输入第%d个字符为和权值",i+1);
scanf("%c",&c);
scanf("%f",&f);
getchar();
HT[i].parent=c;
HT[i].weight=f;
}
return 1;
}
//算法5.11 根据赫夫曼树求赫夫曼编码
#include<iostream>
#include<cstring>
using namespace std;
typedef struct
{
int weight;
int parent,lchild,rchild;
}HTNode,*HuffmanTree;
typedef char **HuffmanCode;
void Select(HuffmanTree HT,int len,int &s1,int &s2)
{
int i,min1=INT_MAX,min2=INT_MAX;//先赋予最大值
for(i=1;i<=len;i++)
{
if(HT[i].weight<min1&&HT[i].parent==0)
{
min1=HT[i].weight;
s1=i;
}
}
int temp=HT[s1].weight;//将原值存放起来,然后先赋予最大值,防止s1被重复选择
HT[s1].weight=INT_MAX;
for(i=1;i<=len;i++)
{
if(HT[i].weight<min2&&HT[i].parent==0)
{
min2=HT[i].weight;
s2=i;
}
}
HT[s1].weight=temp;//恢复原来的值
}
//用算法5.10构造赫夫曼树
void CreatHuffmanTree(HuffmanTree &HT,int n)
{
//构造赫夫曼树HT
int m,s1,s2,i;
if(n<=1) return;
m=2*n-1;//一棵有n个叶子结点的哈夫曼树共有2n-1个结点
HT=new HTNode[m+1]; //0号单元未用,所以需要动态分配m+1个单元,HT[m]表示根结点
for(i=1;i<=m;++i) //将1~m号单元中的双亲、左孩子,右孩子的下标都初始化为0
{ HT[i].parent=0; HT[i].lchild=0; HT[i].rchild=0; }
cout<<"请输入叶子结点的权值:\n";
for(i=1;i<=n;++i) //输入前n个单元中叶子结点的权值
cin>>HT[i].weight;
/*――――――――――初始化工作结束,下面开始创建赫夫曼树――――――――――*/
for(i=n+1;i<=m;++i)
{ //通过n-1次的选择、删除、合并来创建赫夫曼树
Select(HT,i-1,s1,s2);
//在HT[k](1≤k≤i-1)中选择两个其##双亲域为0且权值最小##的结点,
// 并返回它们在HT中的序号s1和s2
HT[s1].parent=i;
HT[s2].parent=i;
//得到新结点i,从森林中删除s1,s2,将s1和s2的双亲域由0改为i
HT[i].lchild=s1;
HT[i].rchild=s2 ; //s1,s2分别作为i的左右孩子
HT[i].weight=HT[s1].weight+HT[s2].weight; //i 的权值为左右孩子权值之和
} //for
}
// CreatHuffmanTree
void CreatHuffmanCode(HuffmanTree HT,HuffmanCode &HC,int n)
{
//从叶子到根逆向求每个字符的赫夫曼编码,存储在编码表HC中
int i,start,c,f;
HC=new char*[n+1]; //分配n个字符编码的头指针矢量
char *cd=new char[n]; //分配临时存放编码的动态数组空间
cd[n-1]='\0'; //编码结束符
for(i=1;i<=n;++i)
{ //逐个字符求赫夫曼编码
start=n-1; //start开始时指向最后,即编码结束符位置
c=i;
f=HT[i].parent; //f指向结点c的双亲结点
while(f!=0)
{ //从叶子结点开始向上回溯,直到根结点
--start; //回溯一次start向前指一个位置
if(HT[f].lchild==c)
cd[start]='0'; //结点c是f的左孩子,则生成代码0
else
cd[start]='1'; //结点c是f的右孩子,则生成代码1
c=f;
f=HT[f].parent; //继续向上回溯
} //求出第i个字符的编码
HC[i]=new char[n-start]; // 为第i 个字符编码分配空间
strcpy(HC[i], &cd[start]); //将求得的编码从临时空间cd复制到HC的当前行中
}
delete cd; //释放临时空间
} // CreatHuffanCode
void show(HuffmanTree HT,HuffmanCode HC,int n)
{
for(int i=1;i<=n;i++)
cout<<HT[i].weight<<"编码为"<<HC[i]<<endl;
}
void decode(HuffmanTree &HT,char *ch,int n)//依次读入电文,根据哈夫曼树译码
{
int i,j=0;
char b[100];
char endflag='#'; //电文结束标志取#
i=2*n-1; //从根结点开始往下搜索
getchar();
cout<<("输入发送的编码(以'#'为结束标志):");
gets(b);
cout<<"译码后的字符为";
while(b[j] != endflag)
{
//填写完整
if (ch=='\0')
{
i=HT[i].lchild;
}
else
{
i=HT[i].rchild;
}
if(HT[i].lchild==0) /*tree[i] 是叶子结点*/
{
printf("%c",HT[i].parent);
i=2*n-1;
}
scanf("%c",&ch);
}
if ((HT[i].lchild!=0)&&(i!=2*n-1)) //电文读完但没到叶子结点
printf("\n未能完全解码\n");
printf("\n");
cout<<endl;
}//decode
int main()
{
HuffmanTree HT;
HuffmanCode HC;
int n,i,c,f;
cout<<"请输入待编码的字符(叶子结点)的个数:\n";
cin>>n;
getchar();
char *p=new char[n];//?
printf("请输入待编码的字符(中间不加空格)");
for(int i=1;i<=n;i++)
cin>>p[i];
CreatHuffmanTree(HT,n);
CreatHuffmanCode(HT,HC,n);
show(HT,HC,n);
//decode(HT,p,n);
printf("【输出每个字符的哈夫曼编码】\n");
for(i=0;i<n;i++) //读入前n个结点的字符及权值
{
printf("输入第%d个字符为和权值",i+1);
scanf("%c",&c);
scanf("%f",&f);
getchar();
HT[i].parent=c;
HT[i].weight=f;
}
return 1;
}