问题描述:给出n个字符的频率ci,给每个字符赋予一个01编码串,使得任意一个字符的编码不是另一个字符编码的前缀,而且编码后总长度(每个字符的频率与编码长度乘积的总和)尽量小。
分析:此处策略为设置变长编码,给低频的编码设置较长,高频的编码设置较短。
任何一个前缀编码都可以表示为每个非叶节点恰好有两个子结点的完全二叉树。左结点为1,右结点为0。叶节点就代表编码,那么最深处的叶节点的频率应该是最低的,而上一个节点的值等于两个叶节点的权值的和,逐步递推之后的总和就是要求的结果。
程序实现:先按照频率吧字符排序成表,创建队列Q,每次合并两个结点吧结点放到队列Q中,后合并的频率一定是比先合并的频率大,故而只要找到首个字母就可以找到频率最小的元素了。
代码后续补上!