给定一段文字,已知单词 a 1 , a 2 , … , a n a_1,a_2,…,a_n a1,a2,…,an 出现的频率分别 t 1 , t 2 , … , t n t_1,t_2,…,t_n t1,t2,…,tn。
可以用 01 01 01 串给这些单词编码,即将每个单词与一个 01 01 01 串对应,使得任何一个单词的编码(对应的 01 01 01 串)不是另一个单词编码的前缀,这种编码称为前缀码。
使用前缀码编码一段文字是指将这段文字中的每个单词依次对应到其编码。
一段文字经过前缀编码后的长度为:
L = a 1 的 编 码 长 度 × t 1 + a 2 的 编 码 长 度 × t 2 + … + a n 的 编 码 长 度 × t n 。 L=a_1 的编码长度 ×t_1+a_2 的编码长度 ×t_2+…+a_n 的编码长度 ×t_n。 L=a1的编码长度×t1+a2的编码长度×t2+…+an的编码长度×tn。
定义一个前缀编码为字典序编码,指对于 1 ≤ i < n 1≤i<n 1≤i<n, a i a_i ai 的编码(对应的 01 01 01 串)的字典序在 a i + 1 a_{i+1} ai+1 编码之前,即 a 1 , a 2 , … , a n a_1,a_2,…,a_n a1,a2,…,an 的编码是按字典序升序排列的。
例如,文字 E A E C D E B C C E C B D B E
中,
5
5
5 个单词
A
、
B
、
C
、
D
、
E
A、B、C、D、E
A、B、C、D、E 出现的频率分别为
1
,
3
,
4
,
2
,
5
1,3,4,2,5
1,3,4,2,5,则一种可行的编码方案是 A:000, B:001, C:01, D:10, E:11
,对应的编码后的
01
01
01 串为 1100011011011001010111010011000111
,对应的长度
L
L
L 为
3
×
1
+
3
×
3
+
2
×
4
+
2
×
2
+
2
×
5
=
34
3×1+3×3+2×4+2×2+2×5=34
3×1+3×3+2×4+2×2+2×5=34。
在这个例子中,如果使用哈夫曼(
H
u
f
f
m
a
n
Huffman
Huffman)编码,对应的编码方案是 A:000, B:01, C:10, D:001, E:11
,虽然最终文字编码后的总长度只有
33
33
33,但是这个编码不满足字典序编码的性质,比如
C
C
C 的编码的字典序不在
D
D
D 的编码之前。
在这个例子中,有些人可能会想的另一个字典序编码是 A:000, B:001, C:010, D:011, E:1
,编码后的文字长度为
35
35
35。
请找出一个字典序编码,使得文字经过编码后的长度 L L L 最小。
在输出时,你只需要输出最小的长度 L L L,而不需要输出具体的方案。
在上面的例子中,最小的长度 L L L 为 34 34 34。
输入格式
输入的第一行包含一个整数
n
n
n,表示单词的数量。
第二行包含 n n n 个整数,用空格分隔,分别表示 a 1 , a 2 , … , a n a_1,a_2,…,a_n a1,a2,…,an 出现的频率,即 t 1 , t 2 , … , t n t_1,t_2,…,t_n t1,t2,…,tn。
请注意 a 1 , a 2 , … , a n a_1,a_2,…,a_n a1,a2,…,an 具体是什么单词并不影响本题的解,所以没有输入 a 1 , a 2 , … , a n a_1,a_2,…,a_n a1,a2,…,an。
输出格式
输出一个整数,表示文字经过编码后的长度
L
L
L 的最小值。
数据范围
对
于
100
%
的
评
测
用
例
,
1
≤
n
≤
1000
,
1
≤
t
i
≤
10000
对于 100\% 的评测用例,1≤n≤1000,1≤t_i≤10000
对于100%的评测用例,1≤n≤1000,1≤ti≤10000。
输入样例:
5
1 3 4 2 5
输出样例:
34
样例解释
这个样例就是问题描述中的例子。如果你得到了
35
35
35,说明你算得有问题,请自行检查自己的算法而不要怀疑是样例输出写错了。
- 区间DP
哈夫曼树
使得任何一个单词的编码(对应的 01 串)不是另一个单词编码的前缀
看到这句话自然想到哈夫曼编码(想出用哈夫曼树解决是关键),但是题干下面又说了
a 1 , a 2 , … , a n a_1,a_2,…,a_n a1,a2,…,an 的编码是按字典序升序排列的
这说明 a 1 , a 2 , … , a n a_1,a_2,…,a_n a1,a2,…,an需要按升序的顺序作为叶子节点出现在树中,既然 n n n个数的位置固定了我们就可以区间DP来解决这个哈夫曼树问题。
经典哈夫曼树问题可以参考:148. 合并果子 (这道题目是直接用堆来解决,因为果子的位置随意)
区间DP可以参考这题:282. 石子合并(这道题是裸区间DP)
#include<bits/stdc++.h>
using namespace std;
const int inf = 0x3f3f3f3f;
const int maxn=1e3+10;
int f[maxn][maxn];
int s[maxn];
int n;
int main() {
scanf("%d", &n);
for (int i = 1; i <= n; i++) {
scanf("%d", &s[i]);
s[i] += s[i - 1];
}
for (int len = 1; len <= n; len++) {
for (int l = 1; l + len - 1 <= n; l++) {
int r = l + len - 1;
if (l == r) f[l][r] = 0;
else {
f[l][r] = inf;
for (int k = l; k < r; k++) {
f[l][r] = min(f[l][r], f[l][k] + f[k + 1][r] + s[r] - s[l - 1]);
}
}
}
}
printf("%d\n", f[1][n]);
return 0;
}