压缩编码

该博客探讨了压缩编码中的字典序编码问题,特别是如何找到一个满足字典序且使编码后文字长度最小的解决方案。文章通过一个例子介绍了问题背景,并指出哈夫曼编码可能不满足字典序。博主提出这个问题实际上是一个矩阵连乘问题,可以通过动态规划来解决,其中状态表示为f[i][j]表示i到j区间内合并的最小代价。
摘要由CSDN通过智能技术生成

压缩编码

给定一段文字,已知单词 a1,a2,…,an 出现的频率分别 t1,t2,…,tn

可以用 01
串给这些单词编码,即将每个单词与一个 01 串对应,使得任何一个单词的编码(对应的 01

串)不是另一个单词编码的前缀,这种编码称为前缀码。

使用前缀码编码一段文字是指将这段文字中的每个单词依次对应到其编码。

一段文字经过前缀编码后的长度为:

L=a1
的编码长度 ×t1+a2 的编码长度 ×t2+…+an 的编码长度 ×tn

定义一个前缀编码为字典序编码,指对于 1≤i<n
,ai 的编码(对应的 01 串)的字典序在 ai+1 编码之前,即 a1,a2,…,an

的编码是按字典序升序排列的。

例如,文字 E A E C D E B C C E C B D B E 中, 5
个单词 A、B、C、D、E 出现的频率分别为 1,3,4,2,5,则一种可行的编码方案是 A:000, B:001, C:01, D:10, E:11,对应的编码后的 01 串为 1100011011011001010111010011000111,对应的长度 L 为 3×1+3×3+2×4+2×2+2×5=34

在这个例子中,如果使用哈夫曼(Huffman)编码,对应的编码方案是 A:000, B:01, C:10, D:001, E:11,虽然最终文字编码后的总长度只有 33
,但是这个编码不满足字典序编码的性质,比如 C 的编码的字典序不在 D

的编码之前。

在这个例子中,有些人可能会想的另一个字典序编码是 A:000, B:001, C:010, D:011, E:1,编码后的文字长度为 35

请找出一个字典序编码,使得文字经过编码后的长度 L

最小。

在输出时,你只需要输出最小的长度 L

,而不需要输出具体的方案。

在上面的例子中,最小的长度 L
为 34


输入格式

输入的第一行包含一个整数 n

,表示单词的数量。

第二行包含 n
个整数,用空格分隔,分别表示 a1,a2,…,an 出现的频率,即 t1,t2,…,tn

请注意 a1,a2,…,an
具体是什么单词并不影响本题的解,所以没有输入 a1,a2,…,an


输出格式

输出一个整数,表示文字经过编码后的长度 L

的最小值。
数据范围

对于 30%
的评测用例,1<n≤10,1≤ti≤20;
对于 60% 的评测用例,1<n≤100,1≤ti≤100;
对于 100% 的评测用例,1<n≤1000,1≤ti≤10000


输入样例:

5
1 3 4 2 5

输出样例:

34

样例解释

这个样例就是问题描

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值