C++ 哈夫曼编码

1.哈夫曼编码的结点类:

struct HuffmanNode {
    int weight; // 权重,出现的次数或者频率
    char ch; // 存储符号
    string code; // 存储该符号对应的编码
    int leftChild, rightChild, parent; // 左、右孩子,父结点
};

2.思路:

 (1)统计输入的字符串中不同字符的出现的次数,作为权值,然后存到哈夫曼编码数组中:

// 2.统计输入的字符串的各个字符出现的个数
    memset(arr, 0, sizeof(arr)); // 清零
    for(i = 0; i < len; i++) // 统计次数
        arr[str[i]]++; // str[i] -> 转成对应的ASCII码,如'0'->48
    leafSize = 0; // 出现不同字符的个数
    for(i = 0; i < 256; i++) {
        if(arr[i] != 0) { // 有出现的字符
            // cout << "字符:" << (char)i << "次数为:" << arr[i] << endl;
            HuffmanTree[leafSize].ch = (char)i; // 将数字转成对应的字符
            HuffmanTree[leafSize].weight = arr[i]; // 权重
            leafSize++;
        }
    }

(2)然后,根据Huffman树的原理:权值越大的离根越近,权值越小的离根越远,建立Huffman树;

// 3.选取两个较小值合并
    int first, second; // 两个较小的结点
    for(i = leafSize; i < (2*leafSize-1); i++) { // 做leafSize-1趟
        getMin(first, second, i); // 选取两个较小的元素
        Merge(first,second,i); // 合并
    }

3)编码:接着,从叶子结点出发,如果该结点为父结点的左孩子,则在编码追加“0”;

                        如果为其右孩子,则编码追加“1”,

    注意上面得到的编码要倒过来存放。因为字符对应的编码是从根到叶子结点所得到的编码,而上面刚好相反。

// 编码:利用哈夫曼编码原理对数据进行加密
void HuffmanCode::Encode() {
    string code; // 存储符号的不定长二进制编码
    int i, j, k, parent;
    
    for(i = 0; i < leafSize; i++) { // 从叶子结点出发
        j = i;
        code = ""; // 初始化为空
        while(HuffmanTree[j].parent != -1) { // 往上找到根结点
            parent = HuffmanTree[j].parent; // 父结点
            if(j == HuffmanTree[parent].leftChild) // 如果是左孩子,则记为0
                code += "0";
            else // 右孩子,记为1
                code += "1";
            j = parent; // 上移到父结点
        }
        // 编码要倒过来:因为是从叶子往上走到根,而编码是要从根走到叶子结点
        for(k = (int)code.size()-1; k >= 0 ; k--)
            HuffmanTree[i].code += code[k]; // 保存编码
        cout << "字符:" << HuffmanTree[i].ch << "的编码为:" << HuffmanTree[i].code << " ";
    }
}

 4)解码:每一次加一个编码数字,然后从哈夫曼编码数组中查找。如果查找到,就转成对应的字符,接着解码剩下的编码;

                     如果没查找到,就再添加一个编码数字,然后从哈夫曼编码数组中查找…

                     如果最后遍历完所有编码,但是还是没有把所有编码解码成功,说明编码中有误,输出“解码出错!”。

// 解码
void HuffmanCode::Decode(string str) {
    string decode, temp; // decode保存整个解码, temp保存每一个解码
    int len = (int)str.size(); // 编码的长度
    int i, j;
    
    decode = temp = ""; // 初始化为空
    for(i = 0; i < len; i++) {
        temp += str[i]; // 加一个编码
        for(j = 0; j < leafSize; j++) {
            if(HuffmanTree[j].code == temp) { // 在叶子结点中找到对应的编码
                decode += HuffmanTree[j].ch; // 转成对应的字符
                temp = "";
                break;
            }
        }
        if(i == len-1 && j == leafSize) { // 遍历完都没找到对应的编码
            cout << "解码出错!" << endl;
            return;
        }
    }
    cout << decode << endl;
}

3.实现程序:

   (1)HuffmanCode.h

#ifndef HuffmanCode_h
#define HuffmanCode_h
#include <iostream>
#include <string>
#include <cstring>
using namespace std;

struct HuffmanNode {
    int weight; // 权重,出现的次数或者频率
    char ch; // 存储符号
    string code; // 存储该符号对应的编码
    int leftChild, rightChild, parent; // 左、右孩子,父结点
};

class HuffmanCode {
public:
    HuffmanCode(string str); // 构造函数
    ~HuffmanCode(); // 析构函数
    void getMin(int &first, int &second, int parent); // 选取两个较小的元素
    void Merge(int first, int second, int parent); // 合并
    void Encode(); // 编码:利用哈夫曼编码原理对数据进行加密
    void Decode(string str); // 解码
private:
    HuffmanNode *HuffmanTree; // 数组
    int leafSize; // 统计不同字符的个数
};

// 构造函数
HuffmanCode::HuffmanCode(string str) {
    int len = (int)str.size(); // 字符串的长度
    int arr[256], i; // 存储字符串各个字符的个数
    HuffmanTree = new HuffmanNode[256]; // 动态分配空间
    
    // 1.初始化HuffmanTree数组
    for(i = 0; i < (2 * len - 1); i++) { // 叶子结点为len,则树最多有2*len-1个结点
        HuffmanTree[i].leftChild = HuffmanTree[i].rightChild = HuffmanTree[i].parent = -1;
        HuffmanTree[i].code = "";
    }
    // 2.统计输入的字符串的各个字符出现的个数
    memset(arr, 0, sizeof(arr)); // 清零
    for(i = 0; i < len; i++) // 统计次数
        arr[str[i]]++; // str[i] -> 转成对应的ASCII码,如'0'->48
    leafSize = 0; // 出现不同字符的个数
    for(i = 0; i < 256; i++) {
        if(arr[i] != 0) { // 有出现的字符
            // cout << "字符:" << (char)i << "次数为:" << arr[i] << endl;
            HuffmanTree[leafSize].ch = (char)i; // 将数字转成对应的字符
            HuffmanTree[leafSize].weight = arr[i]; // 权重
            leafSize++;
        }
    }
    
    // 3.选取两个较小值合并
    int first, second; // 两个较小的结点
    for(i = leafSize; i < (2*leafSize-1); i++) { // 做leafSize-1趟
        getMin(first, second, i); // 选取两个较小的元素
        Merge(first,second,i); // 合并
    }
}

// 析构函数
HuffmanCode::~HuffmanCode() {
    delete []HuffmanTree;
}

// 选取权值两个较小的元素
void HuffmanCode::getMin(int &first, int &second, int parent) {
    double weight = 0;
    int i;
    
    // 找权重最小元素
    for(i = 0; i < parent; i++) {
        if(HuffmanTree[i].parent != -1) // 已选过,直接跳过
            continue;
        if(weight == 0) { // 第一次找到没选过的结点
            weight = HuffmanTree[i].weight;
            first = i;
        }
        else if(HuffmanTree[i].weight < weight) { // 权值更小
            weight = HuffmanTree[i].weight;
            first = i;
        }
    }
    // 找权重次小元素
    weight = 0;
    for(i = 0; i < parent; i++) {
        if(HuffmanTree[i].parent != -1 || i == first) // 已选过,直接跳过
            continue;
        if(weight == 0) { // 第一次找到没选过的结点
            weight = HuffmanTree[i].weight;
            second = i;
        }
        else if(HuffmanTree[i].weight < weight) { // 权值更小
            weight = HuffmanTree[i].weight;
            second = i;
        }
    }
}

// 合并
void HuffmanCode::Merge(int first, int second, int parent) {
    HuffmanTree[first].parent = HuffmanTree[second].parent = parent; // 父结点
    HuffmanTree[parent].leftChild = first; // 左孩子
    HuffmanTree[parent].rightChild = second; // 右孩子
    HuffmanTree[parent].weight = HuffmanTree[first].weight + HuffmanTree[second].weight; // 权值
}

// 编码:利用哈夫曼编码原理对数据进行加密
void HuffmanCode::Encode() {
    string code; // 存储符号的不定长二进制编码
    int i, j, k, parent;
    
    for(i = 0; i < leafSize; i++) { // 从叶子结点出发
        j = i;
        code = ""; // 初始化为空
        while(HuffmanTree[j].parent != -1) { // 往上找到根结点
            parent = HuffmanTree[j].parent; // 父结点
            if(j == HuffmanTree[parent].leftChild) // 如果是左孩子,则记为0
                code += "0";
            else // 右孩子,记为1
                code += "1";
            j = parent; // 上移到父结点
        }
        // 编码要倒过来:因为是从叶子往上走到根,而编码是要从根走到叶子结点
        for(k = (int)code.size()-1; k >= 0 ; k--)
            HuffmanTree[i].code += code[k]; // 保存编码
        cout << "字符:" << HuffmanTree[i].ch << "的编码为:" << HuffmanTree[i].code << " ";
    }
}

// 解码
void HuffmanCode::Decode(string str) {
    string decode, temp; // decode保存整个解码, temp保存每一个解码
    int len = (int)str.size(); // 编码的长度
    int i, j;
    
    decode = temp = ""; // 初始化为空
    for(i = 0; i < len; i++) {
        temp += str[i]; // 加一个编码
        for(j = 0; j < leafSize; j++) {
            if(HuffmanTree[j].code == temp) { // 在叶子结点中找到对应的编码
                decode += HuffmanTree[j].ch; // 转成对应的字符
                temp = "";
                break;
            }
        }
        if(i == len-1 && j == leafSize) { // 遍历完都没找到对应的编码
            cout << "解码出错!" << endl;
            return;
        }
    }
    cout << decode << endl;
}
#endif /* HuffmanCode_h */

(2)main.cpp

#include "HuffmanCode.h"

int main(int argc, const char * argv[]) {
    string str;
    
    cout << "请输入字符串进行编码:" << endl;
    cin >> str; // 输入要加密的字符串
    HuffmanCode st(str); // 对象
    cout << "对字符串编码情况如下:" << endl;
    st.Encode(); // 编码
    cout << endl;
    cout << "请输入要解码的二进制编码:" << endl;
    cin >> str;
    cout << "解码如下:" << endl;
    st.Decode(str); // 解码
    return 0;
}

测试数据Myfatherwasaself-taughtmandolinplayer.Hewasoneofthebeststringinstrumentplayersinourtown.

10000010111100011110010101000011001-> Myfather

测试结果:

  • 80
    点赞
  • 311
    收藏
    觉得还不错? 一键收藏
  • 10
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 10
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值