哈夫曼编译码器
目录
需求分析
1. 哈夫曼编译码器的功能是:
1.1 初始化
从文件“ HuffmanCode.txt ” 读入字符集大小n,以及n个字符和n个权值,建立哈夫曼树,并构建哈夫曼编码表。
1.2 编码
利用已建好的哈夫曼树,对文件“ 明文.txt ”中的正文进行编码,然后将结果存入文件“ HuffmanEnCode.txt ”中。
1.3 译码
利用已建好的哈夫曼树将文件“ 密文.txt ” 中的代码进行译码,结果存入文件“ HuffmanDeCode.txt ”中。
1.4 输入哈夫曼编码表
将哈夫曼编码表打印到屏幕上。
2. 设计思路
用结构体数组存储哈夫曼树,用字符串数组存储哈夫曼编码表。
3. 设计思路分析
将所有单元中的双亲、左孩子、右孩子的下标都初始化为0,再输入n个单元中叶子结点的字符、权值。通过n-1次的选择、删除与合并来创建哈夫曼树。选择功能另有函数说明,删除即将结点s1 和 s2 的双亲改为其下标值;合并即将s1 和 s2 的权值和作为一个新的权值依次存入到数组的第n+1 之后的单元中,同时记录这个新结点左孩子的下标为s1 ,右孩子的下标为s2。
(1)编码
有了字符集的哈夫曼编码表之后,对数据文件的编码过程是:依次读人文件中的字符c.在哈夫曼编码表HC中找到此字符,将字符C转换为编码表中存放的编码串。
(2)译码
对编码后的文件进行译码的过程必须借助于哈夫曼树。具体过程是:依次读人文件的二进制码,从哈夫曼树的根结点(即HT[m])出发,若当前读人0,则走向左孩子,否则走向右孩子。且到达某-叶子HT[]时便译出相应的字符编码HC[]。然后重新从根出发继续译码,直至文件结束。
4. 测试数据:
1、abcdefg编码-> 01101111111111101100000011110101010111100000
2、aebdcdfd编码->011011111101011111000001111011000000110101000001
3、01101111111111101100000011110101010111100000译码->abcdefg
4、0110011110001001101111110000101000110110111011000->Huantao
概要设计(源代码)
1、元素类型、结点类型和指针类型:
typedef struct {
char c;
int weight;
int parent, lchild, rchild;
}HTNode, * HuffmanTree;
typedef char ** HuffmanCode;//动态分配数组储存的哈夫曼编码表
2、创建哈夫曼树:
int CreateHuffmanTree(HuffmanTree& HT, int &n) {
int root;//记录数根
int s1=0, s2=0;
//初始化
int m;//总结点数
m = 2 * n - 1;
HT = new HTNode[m + 1];
infile(HT, n);
for (int i = 1; i <= m; ++i) {
HT[i].parent = 0;
HT[i].lchild = 0;
HT[i].rchild = 0;
}
//创建哈夫曼树
for (int i = n + 1; i <= m; ++i)
{
Select(HT, i - 1, s1, s2);
HT[s1].parent = i; HT[s2].parent = i;
HT[i].lchild = s1;
HT[i].rchild = s2;
HT[i].weight = HT[s1].weight + HT[s2].weight;
}
m = 2 * n - 1;
return m;
}
3、Select()选择权值最小的结点
void Select(HuffmanTree HT, int n,int &s1,int &s2) {
//cout << "select() is working";
//cout << n << endl;
int min = 4000l;
for (int i = 1; i <=n; ++i) {
if(min> HT[i].weight&&HT[i].parent==0){//双亲为零
s1= i;
min = HT[i].weight;
}
}
min = 4000l;
for (int i = 1; i <=n; ++i) {
if (min > HT[i].weight&& i != s1&&HT[i].parent == 0) {
s2 = i;
min = HT[i].weight;
}
}
}
4、创建哈夫曼编码表
void CreatHuffmanCode(HuffmanTree HT, HuffmanCode& HC, int n) {
HC = new char * [n + 1];//分配储存n个字符编码的编码表空间
//cd的类型是什么
char* cd = new char[n];//分配临时存放每个字符编码的动态数组空间
cd[n - 1] = '\0';//编码结束符
int start;//记录编码在cd中存放的位置
int f;//记录i的双亲结点的下标
int c;//记录从叶子结点向上回溯至根结点所经过的结点下标,
for (int i = 1; i <= n; ++i) {//逐个字符求哈夫曼编码
//cout << "第" << i << "个开始回溯" << endl;
start = n - 1;//start开始时指向最后,即编码结束符的位置
c = i;//当前待编码字符的下标
f = HT[i].parent;
while (f != 0) {//从叶子结点开始回溯,直到根结点结束
--start;
if (HT[f].lchild == c) cd[start] = '0';//左结点,生成0
else cd[start] = '1';//右节点,生成1
c = f;
f = HT[f].parent;//继续向上回溯
}
HC[i] = new char[n - start];
strcpy_s(HC[i], strlen(&cd[start])+1, &cd[start]);//将求得的编码从临时空间cd复制到HC的当前行中
}
delete []cd;//释放临时空间
}
5、编码功能实现EnCode():
void EnCode(HuffmanTree HT,HuffmanCode HC,int n) {
char c;
int i=0;
//在HC中找到此字符,将字符c转换为编码表中存放的编码串。
//读取明文文件
//1.建立文件对象
fstream infile;
fstream ofile;
//2.打开文件
infile.open("明文.txt", ios::in);
if (!infile)
{
cout << "明文文件打开失败!!" << endl;
exit(0);
}
ofile.open("HuffmanEnCode.txt");
if (!ofile)
{
cout << "目标文件打开失败!!" << endl;
exit(0);
}
//3.读文件
int k;
while (infile >> c) {
k = locate(HT,n,c);
cout << HC[k]<<endl;
ofile << HC[k];
++i;
}
if (i == 0)
cout << "文件为空,请添加内容!" << endl;
//4.关闭文件
infile.close();
ofile.close();
}
6、译码功能实现:
void HuffmanDecode(HuffmanTree HT, int n) {
char decode[100];
int i=1, len=0, p=0;
fstream infile,ofile;
//2.打开文件
infile.open("密文.txt", ios::in);
ofile.open("HuffmanDeCode.txt",ios::out);
if (!infile||!ofile)
{
cout << "文件打开失败!!" << endl;
exit(0);
}
//3.读文件
int k;
p = 2 * n - 1;
while (infile >> decode[i]) {
i++;
}
len = i-1;//长度减一
if (i == 0)
cout << "文件为空,请添加内容!" << endl;
//4.关闭文件
infile.close();
for (i = 1; i <= len+1; i++) {//注意边界值
if (HT[p].lchild == 0 && HT[p].rchild == 0) {
cout << HT[p].c;
ofile << HT[p].c;
p = 2 * n - 1;
}
if (decode[i] == '0')
p = HT[p].lchild;
else if (decode[i] == '1')
p = HT[p].rchild;
}
}
7、主函数和其他函数:
int main() {
int n=0;
int m=0;//记录哈夫曼树根
HuffmanTree HT;
HuffmanCode HC;
n = infile_n();
CreateHuffmanTree(HT,n);
CreatHuffmanCode(HT, HC, n);
menu(HT, HC,n);
return 0;
}
主菜单函数:
void menu(HuffmanTree &HT, HuffmanCode &HC, int n) {
int choice = 1;
cout << " 使用说明:"<<endl;
cout << " 文件:“HumanCode.txt中”字符及其权重。" << endl;
cout << " 文件:“明文.txt中”存放待编码的字符。"<<endl<<" 文件:“HuffmanEnCode.txt”为存放哈夫曼编码的目标文件"<<endl;
cout << " 文件:“密文.txt” 存放待译码的字符。" << endl << " 文件:“HuffmanEnCode.txt”为存放哈夫曼编码的目标文件" << endl;
while (1)
{
cout << "**************主菜单**************" << endl;
cout << " 1.译码" << endl;
cout << " 2.编码" << endl;
cout << " 3.哈夫曼编码表" << endl;
cout << " 0.退出" << endl;
cout << "**********************************" << endl;
cout << "请输入所要操作的编号:";
cin >> choice;
switch (choice)
{
case 1:
cout << "哈夫曼译码结果" << endl;
HuffmanDecode(HT, n);
cout << endl;
break;
case 2:
cout << "哈夫曼编码结果" << endl;
EnCode(HT, HC, n);
cout << endl;
break;
case 3:
ShowHuffmanCode(HT,HC, n);
cout << endl;
break;
// case 4: ;break;
case 0: cout << "谢谢您的使用!" << endl; exit(0); break;
default:cout << "请输入0~4之间的数字!" << endl; break;
}
}
}
显示编码表函数:
void ShowHuffmanCode(HuffmanTree HT,HuffmanCode HC,int n) {
for (int i = 1; i <= n; ++i) {
cout << HT[i].c<< "编码为";
cout << HC[i] << endl;
}
}
5. 调用关系图
end!!!
心得体会
通过这次课程设计,我熟悉许多概念并提高了用所学的知识来解决问题的能力。
哈夫曼树又称最优树,是一类带权路径长度最短的树,在实际中有广泛的用途。
总结
哈夫曼树概念的定义
(1)路径:从树中一个结点到另个结点之间的分支构成这两个结点之间的路径。
(2)路径长度:路径上的分支数目称作路径长度。
(3)树的路径长度:从树根到每结点的路径长度之和。
(4)权:赋予某个实体的一个量, 是对实体的某个或某些属性的数值化描述。在数据结构中,实体有结点和边两大类,所以对应有结点权和边权。
(5)结点的带权路径长度:从该结点到树根之间的路径长度与结点上权的乘积。
(6)树的带权路径长度:树中所有叶子结点的带权路径长度之和,通常记作WPL
(7)哈夫曼树:假设有m个权值,可以构造一棵含n个叶子结点的二又怀。每个叶子结点的权为w.则其中带权路径长度WP最小的二叉树称做最优二又树或哈夫曼树
哈夫曼树的构造算法过程:
(1)根据给定的n个权值{w1,w.. },构造n棵只有根结点的二叉树这n棵二又树构成一个森林F。1
(2)在森林F中选取两棵根结点的权值最小的树作为左右子树构造 棵新的二叉树,目置新的二叉树的根结点的权值为其左、右子树上根结点的权值之和。
(3)在森林F中删除这两棵树,同时将新得到的二叉树加人F中。
(4)重复(2)和(3).直到F只含-棵树为止。这棵树便是哈夫曼树。