石子问题

最新推荐文章于 2020-12-17 11:22:14 发布

Rebaccaminmin

最新推荐文章于 2020-12-17 11:22:14 发布

阅读量556

点赞数

文章标签： ccf c++

本文链接：https://blog.csdn.net/rebaccaminmin/article/details/73717878

版权

CCF的一道题：
问题描述
　　给定一段文字，已知单词a1, a2, …, an出现的频率分别t1, t2, …, tn。可以用01串给这些单词编码，即将每个单词与一个01串对应，使得任何一个单词的编码（对应的01串）不是另一个单词编码的前缀，这种编码称为前缀码。
　　使用前缀码编码一段文字是指将这段文字中的每个单词依次对应到其编码。一段文字经过前缀编码后的长度为：
　　L=a1的编码长度×t1+a2的编码长度×t2+…+ an的编码长度×tn。
　　定义一个前缀编码为字典序编码，指对于1 ≤ i < n，ai的编码（对应的01串）的字典序在ai+1编码之前，即a1, a2, …, an的编码是按字典序升序排列的。
　　例如，文字E A E C D E B C C E C B D B E中， 5个单词A、B、C、D、E出现的频率分别为1, 3, 4, 2, 5，则一种可行的编码方案是A:000, B:001, C:01, D:10, E:11，对应的编码后的01串为1100011011011001010111010011000111，对应的长度L为3×1+3×3+2×4+2×2+2×5=34。
　　在这个例子中，如果使用哈夫曼(Huffman)编码，对应的编码方案是A:000, B:01, C:10, D:001, E:11，虽然最终文字编码后的总长度只有33，但是这个编码不满足字典序编码的性质，比如C的编码的字典序不在D的编码之前。
　　在这个例子中，有些人可能会想的另一个字典序编码是A:000, B:001, C:010, D:011, E:1，编码后的文字长度为35。
　　请找出一个字典序编码，使得文字经过编码后的长度L最小。在输出时，你只需要输出最小的长度L，而不需要输出具体的方案。在上面的例子中，最小的长度L为34。
输入格式
　　输入的第一行包含一个整数n，表示单词的数量。
　　第二行包含n个整数，用空格分隔，分别表示a1, a2, …, an出现的频率，即t1, t2, …, tn。请注意a1, a2, …, an具体是什么单词并不影响本题的解，所以没有输入a1, a2, …, an。
输出格式
　　输出一个整数，表示文字经过编码后的长度L的最小值。
样例输入
5
1 3 4 2 5
样例输出
34
样例说明
　　这个样例就是问题描述中的例子。如果你得到了35，说明你算得有问题，请自行检查自己的算法而不要怀疑是样例输出写错了。
评测用例规模与约定
　　对于30%的评测用例，1 ≤ n ≤ 10，1 ≤ ti ≤ 20；
　　对于60%的评测用例，1 ≤ n ≤ 100，1 ≤ ti ≤ 100；
　　对于100%的评测用例，1 ≤ n ≤ 1000，1 ≤ ti ≤ 10000。
解题思路：
这道题是一个经典的石子合并问题，因为要考虑编码的顺序，所以每次合并的是相邻的两个堆代价最小，代价自然就是两个堆的石子数之和，其实也很好理解，石子数少的，编码长度常就是一层，每次合并都说明合并的两堆形成了一个新的树，也就是多了一层，每个元素都多了一个0/1，所以每个元素都要再加一次，代价增加了一。
既然是dp问题，第一是找变量，变量就是上面说的代价——石子数之和，接着就需要找状态转移公式：
dp[i][j]=0 i==j
dp[i][j]=min(dp[i][k]+dp[k+1][j])+sum[i][j] (i!=j)
然后开始编码（提交100分）：

#include <iostream>
#include<string.h>
#define N 1001
#define MAX 0X7F7F7F7F
using namespace std;
    int n;
int sum[N];
int dp[N][N];
int p[N][N];


int main()
{
    cin>>n;
    int a[N];
    sum[0]=0;
    memset(dp,MAX,sizeof(dp));
    for(int i=1;i<=n;i++){
        cin>>a[i];
        sum[i]=sum[i-1]+a[i];
        dp[i][i]=0;
        p[i][i]=i;
    }
    //dp
    for(int len=1;len<n;len++)
        for(int i=1;i+len<=n;i++)
    {     int j=i+len;
        for(int k=p[i][j-1];k<=p[i+1][j];k++)
        {
            int val=dp[i][k]+dp[k+1][j]+sum[j]-sum[i-1];
            if(dp[i][j]>val){
                dp[i][j]=val;
                p[i][j]=k;
            }
        }
    }
    cout<<dp[1][n];
    return 0;
}

其实关键的地方就是dp那部分：p数组保存的是i到j的合并最小k值，len表示长度，i表示开始点，j表示结束点，这里的k范围从i点到j-1点的一直到i+1到j点，将所有合适的k（i~j）之间都遍历了一遍。这里的k如果从公式来看应该是从i-1到j-1均遍历一遍才行，但可根据平行四边形优化法则：p[i][j-1]<=p[i][j]<=p[i+1][j]。
也就是先考虑间距小（从1 开始），然后在间距为1的时候，即相邻的定点之间从12、23、34一直到最后，计算这些相邻定点对之间的dp值，然后再计算间距增加。。最后得到dp[1][n]的最小值。

Rebaccaminmin

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
石子问题

CCF的一道题：问题描述　　给定一段文字，已知单词a1, a2, …, an出现的频率分别t1, t2, …, tn。可以用01串给这些单词编码，即将每个单词与一个01串对应，使得任何一个单词的编码（对应的01串）不是另一个单词编码的前缀，这种编码称为前缀码。　　使用前缀码编码一段文字是指将这段文字中的每个单词依次对应到其编码。一段文字经过前缀编码后的长度为：　　L=a1的编码长度×
复制链接

扫一扫