贿赂囚犯 Bribe the prisoners （动态规划+剪枝）

最新推荐文章于 2019-07-25 12:03:07 发布

weixin_30682415

最新推荐文章于 2019-07-25 12:03:07 发布

阅读量206

点赞数 1

文章标签：数据结构与算法

原文链接：http://www.cnblogs.com/cmmdc/p/7204991.html

版权

一个监狱里有P个并排着的牢房，从左往右一次编号为1,2,…,P。最初所有牢房里面都住着一个囚犯。现在要释放一些囚犯。如果释放某个牢房里的囚犯，必须要贿赂两边所有的囚犯一个金币，直到监狱的两端或者空牢房为止。现在要释放a1,a2,...,aQ号囚犯，如何选择释放的顺序，使得使用的金币最少。

思路：

其中很重要的一点：释放了某个囚犯以后，就把连续的牢房分成了没有任何关系的两段。
只要枚举出所有的释放囚犯的顺序即可，复杂度为 O(Q3)。

利用动态规划枚举所有的情况的时候，我们有2种方法：
方法1.（自上而下）先选取首先释放的囚犯。然后划分没两段独立的部分，然后对左右两段再递归的调用。
方法2.（自下而上）利用动态规划数组，例举出所有最小的子问题，然后再根据最小的子问题可以组合成稍大一点的子问题。

用二叉树的来表示可能更形象一点：
针对每个释放顺序，都可以用一个二叉树来表示
例如：有 1-8个囚犯，释放顺序为：4，2，6的话
1、先释放4

2、释放2

3、释放6

可以看出，当释放4号的时候，就把原先的1-8号分为1-3号和5-8号两段独立的，所以上面的第二步和第三步其实可以交换的，
当然这个例子比较简单，不过其实再复杂的问题也就是上面的这些情况的不断叠加而已，比如上面这个二叉树也可能是更大的二叉树的一个部分。

然后我们再回过来，用二叉树的表示方法来再来说一下上面的2个方法，可能方法1比较容易理解，人的一般思维方式都是这样的，然后重点说说方法2
方法2的思想是：
例如要释放 a1,a2,...,aQ囚犯，我们记为A[1]-A[Q],先分成最小的区间开始找，为了方便，我们把两端也加入，这样变为A[0]-A[Q+1]
什么叫最小的区间？就是在区间里面只有一个要释放的囚犯，这样的区间（长度为2）是 A[0]−A[2],A[1]−A[3]..A[Q−1]−A[Q+1],求出其对应的金币，我们记为Cost[0][2],Cost[1][3]...Cost[Q−1][Q+1]
然后我们再找区间里面只有两个要释放的囚犯，这样区间（长度为3）可以用上面长度为2的区间来求得例如 A[0]-A[3]
如果先释放1号，对应的是Cost[1][3]加上a0与a1之间的囚犯数
如果先释放2号，对应的是Cost[0][2]加上a2与a3之间的囚犯数
然后Cost[0][3]就是上面值更小的一个情况
这样不断迭代，最后就可以求出Cost[0][Q+1]，就是最后的答案

枚举的时候，由于可能会出现多次相同的情况，但前面又已经计算过了，所以可以利用一个数组，来保存已经计算过的情况（剪枝）。

代码：

#include<stdio.h>
#define INT_MAX 0x3f3f3f3f
using namespace std;
int p,Q ;
//区间动态规划
//bribe the prisoner
//定义一个二维数组。依次用来填充最小的花费。
int dp[109][109];//表示从第i个填充到j个时的最小花费。
//同时定义一个存放罪犯的数组。
int a[109];
void solve()
{
    a[0]=0;
    a[Q+1]=p+1;//为了解决边界问题。
    for(int i=0; i<=Q; i++)
        dp[i][i+1]=0;//初始化，因为所有的从i到i+1的花费除去边界都是0；
    //循环求解。定义w表示区间的范围，w=2表示跨度为2的情况，也就是该区间里面只有一个要释放的犯人
    for(int w=2; w<=Q+1; w++)
    {
        //每次选的范围都是w，从i到j 的范围内的最小值等于从i到K加从第k到j的最小值。
        for(int i=0; i+w<=Q+1; i++)
        {
            //此处用到的k恰是其中的中值。
            int j=i+w,tmp=INT_MAX;//tmp用来保存当前区间的当前最好情况的花费金币数
            for(int k=i+1; k<j; k++)
                tmp=min(tmp,dp[i][k]+dp[k][j]);
            dp[i][j]=tmp+a[j]-a[i]-2;//此处就是当前区间最小值。
        }
    }
    printf("%d\n",dp[0][Q+1]);
}
int main()
{
    scanf("%d%d",&p,&Q);
    for(int i=1; i<=Q; i++)
        scanf("%d",&a[i]);
    solve();
    return 0;
}

转载于:https://www.cnblogs.com/cmmdc/p/7204991.html