1.需求分析
利用小堆,huffman编码,文件流操作,二进制文件的读写实现对普通文件的压缩和解压过程。
2.能力要求
A.熟悉对文件的读写操作。
B.熟悉小堆的原理。
C.熟悉HuffmanTree的实现原理、
D.会编码的获取。
E.对编码信息处理和存储。
F.最重要一点,要理解压缩和解压缩的过程。
3.模块介绍。
A设计的存储结构。.
B.压缩过程.
C.解压缩过程。
D.编码的获取。.
E.HuffmanTree的实现。
F.小堆的实现。
G.读文件的操作。
4.压缩和解压缩的原理。
压缩过程:利用数据结构,对文件里面的字符进行统计。以字符出现的频率构建小堆,再利用小堆,构建HuffmanTree。以HuffmanTree左右孩子遍历,左为0,右为1.将统计出来的结果存放到自己设计的结构中。在通过对字符编码进行位进制压缩,可以实现压缩过程。
解压缩过程:利用字符和统计次数写配置文件,解压缩就可以通过配置文件建立一颗HuffmanTree,在根据压缩文件内容遍历HuffmanTree,叶子节点即为原来的一个字符。
5.模块具体分析。
A设计的存储结构。
typedef long longtype;
struct FileInfo
{
unsigned char _ch; //字符
longtype _count; //计数器
string _code; //Huffman编码
}
B.压缩过程.
1.先把文件内容读进来,并进行字符统计。
2.统计字符出现字数,存入_count。
3.依据每个节点的_count值,构建相应的huffman树。
4.将编码压缩,存入文件。
5.把字符和出现次数按照(字符,次数)的形式,每行的保存到配置文件里。