作用:减少文件占用空间(文件压缩)
大致原理:
- 统计文件中每一个字符的出现次数
- 画一棵树,每个字母在不同的叶子上,每片叶子有不同的编号
- 使用这些编号代表每个字母,翻译一遍原文,获得更小的文件体积
一些原理中的问题:
为什么每片叶子有不同的编号?
答:二叉树,左边代表0,右边代表1,比如上图各字符对应的编码为:A->11,B->10,C->00,D->011,E->010。每个节点都有不同的编号。在获得编号之后,直接将原字符使用编号替代,由于编号只占2-3个字节,而原字符占7-8个字节,因此得以压缩。
哈夫曼算法的作用?
答:按贪婪算法构造字符的编码树,使翻译后文件的体积最小。