1. 基本思想
按照字符出现的频率编码,比如有3个字符,就可以用2个比特来表示,不过随着字符数量的增加,比特数也会增加,有可能会浪费空间,所以进一步用更少的比特表示频率更高的字符,用更多的比特表示频率更低的字符,但是这样会有一个问题是再解码时不知道到底要对多少个字符进行解码,所以进一步引出霍夫曼编码,避免字符的编码的前缀相同,通过构建二叉树,从频率最小的字符开始,结点值为字符出现的频率,先将所有频率对应一个结点放入队列中,每次取出最小的2个合并,将合并的结点加入队列,重复这个过程,直到队列为空,最终编码的时候左子树编码为0,右子树编码为1即可