ACM-ICPC真题讲解：“哈夫曼编码”

緒山 まひろ

于 2024-07-29 14:07:01 发布

阅读量263

点赞数 11

分类专栏： c++算法 c++算法/数据结构/ACM真题文章标签：算法数据结构

本文链接：https://blog.csdn.net/2301_77059978/article/details/140769841

版权

c++算法/数据结构/ACM真题同时被 2 个专栏收录

8 篇文章 0 订阅

订阅专栏

c++算法

7 篇文章 0 订阅

订阅专栏

哈夫曼编码（Huffman Coding）是一种用于数据压缩的编码算法，它由David A. Huffman在1952年发明。这种编码方法特别适用于变长编码，可以有效地减少数据的存储空间。在ACM-ICPC等编程竞赛中，哈夫曼编码是一个常见的题目，考验参赛者对数据结构和算法的理解和应用能力。

哈夫曼编码原理

哈夫曼编码的核心思想是利用字符出现的频率来构建一个最优的二叉树，使得每个字符的编码长度尽可能短。构建过程如下：

统计频率：首先统计每个字符出现的频率。
构建优先队列：将每个字符及其频率作为节点，构建一个优先队列（通常是最小堆）。
构建哈夫曼树：不断从优先队列中取出两个频率最小的节点，将它们合并为一个新节点，新节点的频率为两个节点频率之和，然后将新节点重新加入优先队列。
生成编码：从根节点开始，向左子树走标记为0，向右子树走标记为1，直到到达叶子节点，此时叶子节点的路径即为对应字符的编码。

哈夫曼编码的C++实现

下面是一个C++实现示例：

#include <iostream>
#include <vector>
#include <queue>
#include <map>
#include <string>

using namespace std;

struct Node {
    char data;
    int freq;
    Node* left;
    Node* right;
    Node(char d, int f) : data(d), freq(f), left(nullptr), right(nullptr) {}
};

// 比较函数，用于最小堆
bool compare(Node* l, Node* r) {
    return l->freq > r->freq;
}

// 构建哈夫曼树
Node* buildHuffmanTree(vector<int> freq) {
    priority_queue<Node*, vector<Node*>, decltype(&compare)> minHeap(compare);
    for (int i = 0; i < freq.size(); ++i) {
        minHeap.push(new Node('A' + i, freq[i]));
    }

    while (minHeap.size() != 1) {
        Node* left = minHeap.top();
        minHeap.pop();
        Node* right = minHeap.top();
        minHeap.pop();
        Node* sum = new Node('$', left->freq + right->freq);
        sum->left = left;
        sum->right = right;
        minHeap.push(sum);
    }
    return minHeap.top();
}

// 打印哈夫曼编码
void printCodes(Node* root, string str) {
    if (root->left == nullptr && root->right == nullptr) {
        cout << root->data << ": " << str << endl;
        return;
    }
    printCodes(root->left, str + "0");
    printCodes(root->right, str + "1");
}

int main() {
    vector<int> freq = {10, 20, 30, 40, 50}; // 假设字符频率
    Node* root = buildHuffmanTree(freq);
    printCodes(root, "");
    return 0;
}