试题编号: | 201612-4 |
试题名称: | 压缩编码 |
时间限制: | 3.0s |
内存限制: | 256.0MB |
问题描述: |
问题描述
给定一段文字,已知单词a
1, a
2, …, a
n出现的频率分别t
1, t
2, …, t
n。可以用01串给这些单词编码,即将每个单词与一个01串对应,使得任何一个单词的编码(对应的01串)不是另一个单词编码的前缀,这种编码称为前缀码。
使用前缀码编码一段文字是指将这段文字中的每个单词依次对应到其编码。一段文字经过前缀编码后的长度为: L=a 1的编码长度×t 1+a 2的编码长度×t 2+…+ a n的编码长度×t n。 定义一个前缀编码为字典序编码,指对于1 ≤ i < n,a i的编码(对应的01串)的字典序在a i +1编码之前,即a 1, a 2, …, a n的编码是按字典序升序排列的。 例如,文字E A E C D E B C C E C B D B E中, 5个单词A、B、C、D、E出现的频率分别为1, 3, 4, 2, 5,则一种可行的编码方案是A:000, B:001, C:01, D:10, E:11,对应的编码后的01串为1100011011011001010111010011000111,对应的长度L为3×1+3×3+2×4+2×2+2×5=34。 在这个例子中,如果使用哈夫曼(Huffman)编码,对应的编码方案是A:000, B:01, C:10, D:001, E:11,虽然最终文字编码后的总长度只有33,但是这个编码不满足字典序编码的性质,比如C的编码的字典序不在D的编码之前。 在这个例子中,有些人可能会想的另一个字典序编码是A:000, B:001, C:010, D:011, E:1,编码后的文字长度为35。 请找出一个字典序编码,使得文字经过编码后的长度L最小。在输出时,你只需要输出最小的长度L,而不需要输出具体的方案。在上面的例子中,最小的长度L为34。
输入格式
输入的第一行包含一个整数n,表示单词的数量。
第二行包含n个整数,用空格分隔,分别表示a 1, a 2, …, a n出现的频率,即t 1, t 2, …, t n。请注意a 1, a 2, …, a n具体是什么单词并不影响本题的解,所以没有输入a 1, a 2, …, a n。
输出格式
输出一个整数,表示文字经过编码后的长度L的最小值。
样例输入
5
1 3 4 2 5
样例输出
34
样例说明
这个样例就是问题描述中的例子。如果你得到了35,说明你算得有问题,请自行检查自己的算法而不要怀疑是样例输出写错了。
评测用例规模与约定
对于30%的评测用例,1 ≤ n ≤ 10,1 ≤ t
i ≤ 20;
对于60%的评测用例,1 ≤ n ≤ 100,1 ≤ t i ≤ 100; 对于100%的评测用例,1 ≤ n ≤ 1000,1 ≤ t i ≤ 10000。 |
题目链接:
http://cspro.org/lead/leadbpm.do?__action=goto_iframe&path=CCF_KS_KSLX_LIST&djtype=TT&2
题目大意:
给定N个数的出现频率,求最小编码使得总长度最小,要求是前缀码,且编码必须从小到大
题目思路:
【区间DP+四边形不等式优化】
设f[i][j]表示i到j的最小编码长度,当合并f[i][k]和f[k+1][j]的时候需要加上区间[i,j]里的所有频率之和。
所以f[i][j]=min(f[i][k]+f[k+1][j]+sum[i][j])
这样写的复杂度是n3的。显然过不去啊
现在考虑优化,注意到f[i][j]取到最优的划分k[i][j]的值满足k[i][j-1]<=k[i][j]<=k[i+1][j]
可以使用四边形不等式优化。每次循环从k[i][j-1]到k[i+1][j],时间复杂度降到n2
/****************************************************
Author : Coolxxx
Copyright 2017 by Coolxxx. All rights reserved.
BLOG : http://blog.csdn.net/u010568270
****************************************************/
#include<bits/stdc++.h>
#pragma comment(linker,"/STACK:1024000000,1024000000")
#define abs(a) ((a)>0?(a):(-(a)))
#define lowbit(a) (a&(-a))
#define sqr(a) ((a)*(a))
#define mem(a,b) memset(a,b,sizeof(a))
#define eps (1e-8)
#define J 10000
#define mod 1000000007
#define MAX 0x7f7f7f7f
#define PI 3.14159265358979323
#define N 2004
using namespace std;
typedef long long LL;
double anss;
LL aans;
int cas,cass;
int n,m,lll,ans;
int a[N],sum[N];
int f[N][N],pos[N][N];
int main()
{
#ifndef ONLINE_JUDGE
freopen("1.txt","r",stdin);
// freopen("2.txt","w",stdout);
#endif
int i,j,k;
int x,y,z;
// for(scanf("%d",&cass);cass;cass--)
// for(scanf("%d",&cas),cass=1;cass<=cas;cass++)
// while(~scanf("%s",s))
while(~scanf("%d",&n))
{
mem(f,0x7f);
for(i=1;i<=n;i++)
{
scanf("%d",&a[i]);
f[i][i]=0;
pos[i][i]=i;
sum[i]=sum[i-1]+a[i];
}
for(z=1;z<n;z++)
{
for(i=1;i+z<=n;i++)
{
j=i+z;
for(k=pos[i][j-1];k<=pos[i+1][j];k++)
{
if(f[i][j]>f[i][k]+f[k+1][j]+sum[j]-sum[i-1])
f[i][j]=f[i][k]+f[k+1][j]+sum[j]-sum[i-1],pos[i][j]=k;
}
}
}
printf("%d\n",f[1][n]);
}
return 0;
}
/*
//
//
*/