利用哈夫曼树实现文件的压缩与解压缩
压缩:
1、统计出文件中相同字符出现的次数
2、获取哈夫曼编码
次数作为权值构建哈夫曼树
3、重新编码,写回压缩文件
保存头文件:
源文件后缀
编码信息的行数
每个字符的权
保存编码
解压缩:
1、获取原文件后缀
2、获取每个字符出现的次数,即权值
3、利用之前后的的权值,还原哈夫曼树
4、找到对应的叶子节点,将信息保存到解压文件中
在写压缩文件之前,首先需要实现堆和哈夫曼树
源代码戳这里
(https://coding.net/u/g33_N/p/fileCompress/git)
#define _CRT_SECURE_NO_DEPRECATE
#include"HuffManTree.h"
#include<assert.h>
struct FileInfo
{
FileInfo()
:_count(0)
{}
unsigned char _ch;//当前字符
size_t _count;//当前字符出现的次数
std::string _strCode;//当前字符的哈夫曼编码
//重载+
FileInfo operator+(const FileInfo& fileInfo)
{
FileInfo ret(*this);
ret._count += fileInfo._count;
return ret;
}
//重载<
bool operator<(const FileInfo& fileInfo)const
{
return _count<fileInfo._count;
}
//重载!=
bool operator != (const FileInfo& fileInfo)const
{
return _count != fileInfo._count;
}
};
class CompressFile
{
public:
CompressFile()
{
for (size_t idx = 0; idx < 256; ++idx)
{
_fileInfo[idx]._ch = idx;
_fileInfo[idx]._count = 0;//每一个字符出现的次数初始化为0
}
}
void FileCount(const std::string& strFileName)
{
//统计字符出现的次数
FILE* fOut = fopen(strFileName.c_str(), "r");//打开一个文件
assert(fOut);
unsigned char rBuf[1024];//存取读到的文件内容
while (1)
{
size_t rSize = fread(rBuf, 1, 1024, fOut);//返回从文件中读到的字节数
if (rSize == 0)
break;
for (size_t idx = 0; idx < rSize; ++idx)
{
_fileInfo[rBuf[idx]]._count++;//统计每个字符出现的次数
}
}
}
//获取编码信息
void GetHuffManCode()
{
// 创建HuffManTree
HuffmanTree<FileInfo> ht(_fileInfo, sizeof(_fileInfo) / sizeof(_fileInfo[0]), FileInfo());
_GetHuffManCode(ht.GetRoot());//获取哈夫曼编码