C++构建哈夫曼树

最新推荐文章于 2024-05-30 09:00:00 发布

学IT的细胞膜

最新推荐文章于 2024-05-30 09:00:00 发布

阅读量380

点赞数 3

分类专栏：数据结构与算法（C++）文章标签： c++ 开发语言数据结构

本文链接：https://blog.csdn.net/2301_79914698/article/details/136788689

版权

数据结构与算法（C++）专栏收录该内容

42 篇文章 0 订阅

订阅专栏

哈夫曼树（Huffman Tree）是一种用于数据压缩的树形数据结构。它是由David A. Huffman在1952年提出的一种权衡树。哈夫曼树的主要思想是利用变长编码（Variable-Length Codes），使得频率高的字符使用较短的编码，频率低的字符使用较长的编码，从而实现对数据进行高效的压缩。

以下是哈夫曼树的基本原理和特点：

1. 构建过程：
- 哈夫曼树是根据给定字符集的频率来构建的。频率越高的字符，在哈夫曼树中离根节点越近。
- 构建哈夫曼树的基本思路是：首先将字符按照出现频率从小到大排序；然后每次从频率最小的两个字符中选取一个，合并为一个新的节点，其频率为两个节点的频率之和；重复这个过程，直到只剩下一个节点，即根节点为止。

2. 特点：
- 哈夫曼树是一棵完全二叉树（所有叶子节点都在同一层），但不是二叉搜索树。
- 由于频率高的字符在哈夫曼树中离根节点较近，所以它们的编码比频率低的字符短。
- 哈夫曼树具有唯一性，即对于给定的字符集和相应的频率，构建出的哈夫曼树是唯一的。

3. 应用：
- 哈夫曼树被广泛应用于数据压缩算法中，如Huffman压缩算法。在这种算法中，通过使用不等长的编码来表示不同字符，以实现对数据的压缩。
- 哈夫曼树也被用于构建哈夫曼编码，以实现数据的高效存储和传输。

总之，哈夫曼树是一种用于数据压缩的树形数据结构，利用字符集中各字符的频率信息来构建。通过合并频率最小的字符来构建树，使得频率高的字符获得较短的编码，从而实现高效的数据压缩。

下面是一个简单的C++程序，用于构建哈夫曼树。为了简化起见，我将专注于构建哈夫曼树的过程，而不涉及从字符频率生成哈夫曼树的完整步骤。在这个示例中，我将使用优先队列来帮助构建哈夫曼树。

#include <iostream>
#include <queue>

using namespace std;

// 定义哈夫曼树节点结构
struct HuffmanNode {
    char data;
    int frequency;
    HuffmanNode* left;
    HuffmanNode* right;

    HuffmanNode(char d, int f) : data(d), frequency(f), left(nullptr), right(nullptr) {}
};

// 比较函数，用于优先队列的排序
struct CompareNodes {
    bool operator()(HuffmanNode* a, HuffmanNode* b) {
        return a->frequency > b->frequency;
    }
};

// 构建哈夫曼树
HuffmanNode* buildHuffmanTree(priority_queue<HuffmanNode*, vector<HuffmanNode*>, CompareNodes>& pq) {
    while (pq.size() > 1) {
        HuffmanNode* left = pq.top();
        pq.pop();
        HuffmanNode* right = pq.top();
        pq.pop();

        HuffmanNode* newNode = new HuffmanNode('$', left->frequency + right->frequency);
        newNode->left = left;
        newNode->right = right;
        pq.push(newNode);
    }

    return pq.top();
}

// 打印哈夫曼树
void printHuffmanTree(HuffmanNode* root, string code) {
    if (root == nullptr)
        return;

    if (root->data != '$')
        cout << root->data << ": " << code << endl;

    printHuffmanTree(root->left, code + "0");
    printHuffmanTree(root->right, code + "1");
}

int main() {
    // 创建字符及对应的频率
    vector<pair<char, int>> data = {{'a', 5}, {'b', 9}, {'c', 12}, {'d', 13}, {'e', 16}, {'f', 45}};

    // 创建优先队列，按照字符频率排序
    priority_queue<HuffmanNode*, vector<HuffmanNode*>, CompareNodes> pq;
    for (auto& it : data) {
        pq.push(new HuffmanNode(it.first, it.second));
    }

    // 构建哈夫曼树
    HuffmanNode* root = buildHuffmanTree(pq);

    // 打印哈夫曼树
    cout << "Huffman Tree: " << endl;
    printHuffmanTree(root, "");

    return 0;
}

在这个示例中，我首先创建了一个包含字符及其频率的向量 data，然后使用优先队列 pq 对字符按频率进行排序。接着，通过 buildHuffmanTree() 函数构建哈夫曼树，最后通过 printHuffmanTree() 函数打印哈夫曼树的结构。

当我们构建哈夫曼树时，我们需要合并频率最低的两个节点，并创建一个新的节点来代表它们的父节点。这个过程需要持续进行，直到只剩下一个节点，即根节点为止。下面是 buildHuffmanTree() 函数的详细解释：

HuffmanNode* buildHuffmanTree(priority_queue<HuffmanNode*, vector<HuffmanNode*>, CompareNodes>& pq) {
    // 当优先队列中的节点数量大于1时，继续构建哈夫曼树
    while (pq.size() > 1) {
        // 从优先队列中取出频率最低的两个节点
        HuffmanNode* left = pq.top();  // 取出频率最低的节点
        pq.pop();
        HuffmanNode* right = pq.top();  // 取出次低频率的节点
        pq.pop();

        // 创建一个新的节点，代表合并后的父节点
        HuffmanNode* newNode = new HuffmanNode('$', left->frequency + right->frequency);
        newNode->left = left;
        newNode->right = right;

        // 将新节点插入到优先队列中
        pq.push(newNode);
    }

    // 最后优先队列中剩下的节点即为哈夫曼树的根节点
    return pq.top();
}

这个函数首先接受一个优先队列作为参数。在循环中，每次从优先队列中取出两个频率最低的节点，然后创建一个新的父节点，其频率为两个子节点的频率之和。接着，将新的父节点插入回优先队列中。这个过程会一直进行，直到优先队列中只剩下一个节点，即哈夫曼树的根节点。最后，函数返回根节点。

这个函数通过合并频率最低的节点，并依次构建父节点，从而逐步构建了整棵哈夫曼树。