数据结构学习——哈夫曼树

最新推荐文章于 2024-04-20 11:37:23 发布

一只野指针吖

最新推荐文章于 2024-04-20 11:37:23 发布

阅读量242

点赞数

文章标签：数据结构学习 c语言

本文链接：https://blog.csdn.net/weixin_62410421/article/details/125034990

版权

文章目录

前言——哈夫曼树
一、实际操作
二、完整代码
三、测试结果

前言——哈夫曼树

在计算机数据处理中，哈夫曼编码使用变长编码表对源符号（如文件中的一个字母）进行编码，其中变长编码表是通过一种评估来源符号出现机率的方法得到的，出现机率高的字母使用较短的编码，反之出现机率低的则使用较长的编码，这便使编码之后的字符串的平均长度、期望值降低，从而达到无损压缩数据的目的。
在这里插入图片描述

一、实际操作

1.定义结构

typedef double DataType; //结点权值的数据类型
 
typedef struct HTNode //单个结点的信息
{
 DataType weight; //权值
 int parent; //父节点
 int lc, rc; //左右孩子
}*HuffmanTree;
 
typedef char **HuffmanCode;

2.找最小两节点

void Select(HuffmanTree& HT, int n, int& s1, int& s2)
{
 int min;
 //找第一个最小值
 for (int i = 1; i <= n; i++)
 {
  if (HT[i].parent == 0)
  {
   min = i;
   break;
  }
 }
 for (int i = min + 1; i <= n; i++)
 {
  if (HT[i].parent == 0 && HT[i].weight < HT[min].weight)
   min = i;
 }
 s1 = min; //第一个最小值给s1
 //找第二个最小值
 for (int i = 1; i <= n; i++)
 {
  if (HT[i].parent == 0 && i != s1)
  {
   min = i;
   break;
  }
 }
 for (int i = min + 1; i <= n; i++)
 {
  if (HT[i].parent == 0 && HT[i].weight < HT[min].weight&&i != s1)
   min = i;
 }
 s2 = min; //第二个最小值给s2
}

3.构建哈夫曼树

void CreateHuff(HuffmanTree& HT, DataType* w, int n)
{
 int m = 2 * n - 1; //哈夫曼树总结点数
 HT = (HuffmanTree)calloc(m + 1, sizeof(HTNode)); //开m+1个HTNode，因为下标为0的HTNode不存储数据
 for (int i = 1; i <= n; i++)
 {
  HT[i].weight = w[i - 1]; //赋权值给n个叶子结点
 }
 for (int i = n + 1; i <= m; i++) //构建哈夫曼树
 {
  //选择权值最小的s1和s2，生成它们的父结点
  int s1, s2;
  Select(HT, i - 1, s1, s2); //在下标为1到i-1的范围找到权值最小的两个值的下标，其中s1的权值小于s2的权值
  HT[i].weight = HT[s1].weight + HT[s2].weight; //i的权重是s1和s2的权重之和
  HT[s1].parent = i; //s1的父亲是i
  HT[s2].parent = i; //s2的父亲是i
  HT[i].lc = s1; //左孩子是s1
  HT[i].rc = s2; //右孩子是s2
 }
 //打印哈夫曼树中各结点之间的关系
 printf("哈夫曼树为:>\n");
 printf("下标   权值     父结点   左孩子   右孩子\n");
 printf("0                                  \n");
 for (int i = 1; i <= m; i++)
 {
  printf("%-4d   %-6.2lf   %-6d   %-6d   %-6d\n", i, HT[i].weight, HT[i].parent, HT[i].lc, HT[i].rc);
 }
 printf("\n");
}

4.生成哈夫曼树

void HuffCoding(HuffmanTree& HT, HuffmanCode& HC, int n)
{
 HC = (HuffmanCode)malloc(sizeof(char*)*(n + 1)); //开n+1个空间，因为下标为0的空间不用
 char* code = (char*)malloc(sizeof(char)*n); //辅助空间，编码最长为n(最长时，前n-1个用于存储数据，最后1个用于存放'\0')
 code[n - 1] = '\0'; //辅助空间最后一个位置为'\0'
 for (int i = 1; i <= n; i++)
 {
  int start = n - 1; //每次生成数据的哈夫曼编码之前，先将start指针指向'\0'
  int c = i; //正在进行的第i个数据的编码
  int p = HT[c].parent; //找到该数据的父结点
  while (p) //直到父结点为0，即父结点为根结点时，停止
  {
   if (HT[p].lc == c) //如果该结点是其父结点的左孩子，则编码为0，否则为1
    code[--start] = '0';
   else
    code[--start] = '1';
   c = p; //继续往上进行编码
   p = HT[c].parent; //c的父结点
  }
  HC[i] = (char*)malloc(sizeof(char)*(n - start)); //开辟用于存储编码的内存空间
  strcpy(HC[i], &code[start]); //将编码拷贝到字符指针数组中的相应位置
 }
 free(code); //释放辅助空间
}

二、完整代码

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
 
typedef double DataType; //结点权值的数据类型
 
typedef struct HTNode //单个结点的信息
{
 DataType weight; //权值
 int parent; //父节点
 int lc, rc; //左右孩子
}*HuffmanTree;
 
typedef char **HuffmanCode; //字符指针数组中存储的元素类型
 
//在下标为1到i-1的范围找到权值最小的两个值的下标，其中s1的权值小于s2的权值
void Select(HuffmanTree& HT, int n, int& s1, int& s2)
{
 int min;
 //找第一个最小值
 for (int i = 1; i <= n; i++)
 {
  if (HT[i].parent == 0)
  {
   min = i;
   break;
  }
 }
 for (int i = min + 1; i <= n; i++)
 {
  if (HT[i].parent == 0 && HT[i].weight < HT[min].weight)
   min = i;
 }
 s1 = min; //第一个最小值给s1
 //找第二个最小值
 for (int i = 1; i <= n; i++)
 {
  if (HT[i].parent == 0 && i != s1)
  {
   min = i;
   break;
  }
 }
 for (int i = min + 1; i <= n; i++)
 {
  if (HT[i].parent == 0 && HT[i].weight < HT[min].weight&&i != s1)
   min = i;
 }
 s2 = min; //第二个最小值给s2
}
 
//构建哈夫曼树
void CreateHuff(HuffmanTree& HT, DataType* w, int n)
{
 int m = 2 * n - 1; //哈夫曼树总结点数
 HT = (HuffmanTree)calloc(m + 1, sizeof(HTNode)); //开m+1个HTNode，因为下标为0的HTNode不存储数据
 for (int i = 1; i <= n; i++)
 {
  HT[i].weight = w[i - 1]; //赋权值给n个叶子结点
 }
 for (int i = n + 1; i <= m; i++) //构建哈夫曼树
 {
  //选择权值最小的s1和s2，生成它们的父结点
  int s1, s2;
  Select(HT, i - 1, s1, s2); //在下标为1到i-1的范围找到权值最小的两个值的下标，其中s1的权值小于s2的权值
  HT[i].weight = HT[s1].weight + HT[s2].weight; //i的权重是s1和s2的权重之和
  HT[s1].parent = i; //s1的父亲是i
  HT[s2].parent = i; //s2的父亲是i
  HT[i].lc = s1; //左孩子是s1
  HT[i].rc = s2; //右孩子是s2
 }
 //打印哈夫曼树中各结点之间的关系
 printf("哈夫曼树为:>\n");
 printf("下标   权值     父结点   左孩子   右孩子\n");
 printf("0                                  \n");
 for (int i = 1; i <= m; i++)
 {
  printf("%-4d   %-6.2lf   %-6d   %-6d   %-6d\n", i, HT[i].weight, HT[i].parent, HT[i].lc, HT[i].rc);
 }
 printf("\n");
}
 
//生成哈夫曼编码
void HuffCoding(HuffmanTree& HT, HuffmanCode& HC, int n)
{
 HC = (HuffmanCode)malloc(sizeof(char*)*(n + 1)); //开n+1个空间，因为下标为0的空间不用
 char* code = (char*)malloc(sizeof(char)*n); //辅助空间，编码最长为n(最长时，前n-1个用于存储数据，最后1个用于存放'\0')
 code[n - 1] = '\0'; //辅助空间最后一个位置为'\0'
 for (int i = 1; i <= n; i++)
 {
  int start = n - 1; //每次生成数据的哈夫曼编码之前，先将start指针指向'\0'
  int c = i; //正在进行的第i个数据的编码
  int p = HT[c].parent; //找到该数据的父结点
  while (p) //直到父结点为0，即父结点为根结点时，停止
  {
   if (HT[p].lc == c) //如果该结点是其父结点的左孩子，则编码为0，否则为1
    code[--start] = '0';
   else
    code[--start] = '1';
   c = p; //继续往上进行编码
   p = HT[c].parent; //c的父结点
  }
  HC[i] = (char*)malloc(sizeof(char)*(n - start)); //开辟用于存储编码的内存空间
  strcpy(HC[i], &code[start]); //将编码拷贝到字符指针数组中的相应位置
 }
 free(code); //释放辅助空间
}
 
//主函数
int main()
{
 int n = 0;
 printf("请输入数据个数:>");
 scanf("%d", &n);
 DataType* w = (DataType*)malloc(sizeof(DataType)*n);
 if (w == NULL)
 {
  printf("malloc fail\n");
  exit(-1);
 }
 printf("请输入数据:>");
 for (int i = 0; i < n; i++)
 {
  scanf("%lf", &w[i]);
 }
 HuffmanTree HT;
 CreateHuff(HT, w, n); //构建哈夫曼树
 
 HuffmanCode HC;
 HuffCoding(HT, HC, n); //构建哈夫曼编码
 
 for (int i = 1; i <= n; i++) //打印哈夫曼编码
 {
  printf("数据%.2lf的编码为:%s\n", HT[i].weight, HC[i]);
 }
 free(w);
 return 0;
}

三、测试结果

请输入数据个数:>5
请输入数据:>0.05 0.98 0.73 0.87 0.94
哈夫曼树为:>
下标   权值     父结点   左孩子   右孩子
0
1      0.05     6        0        0
2      0.98     8        0        0
3      0.73     6        0        0
4      0.87     7        0        0
5      0.94     8        0        0
6      0.78     7        1        3
7      1.65     9        6        4
8      1.92     9        5        2
9      3.57     0        7        8
 
数据0.05的编码为:000
数据0.98的编码为:11
数据0.73的编码为:001
数据0.87的编码为:01
数据0.94的编码为:10

一只野指针吖

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
数据结构学习——哈夫曼树

文章目录前言——哈夫曼树一、实际操作1.定义结构2.找最小两节点3.构建哈夫曼树4.生成哈夫曼树二、完整代码三、测试结果前言——哈夫曼树在计算机数据处理中，哈夫曼编码使用变长编码表对源符号（如文件中的一个字母）进行编码，其中变长编码表是通过一种评估来源符号出现机率的方法得到的，出现机率高的字母使用较短的编码，反之出现机率低的则使用较长的编码，这便使编码之后的字符串的平均长度、期望值降低，从而达到无损压缩数据的目的。一、实际操作1.定义结构typedef double DataType; //结
复制链接

扫一扫