POJ1015 - Jury Compromise(DP+计算顺序)

这篇博客介绍了POJ1015问题的解决过程,涉及动态规划(DP)和计算顺序的重要性的讨论。作者在解决过程中遇到了超时和失解的问题,最终通过从前向后递推并避免元素重复使用的方法找到正确解决方案。文章强调了DP状态转移的正确计算顺序对于得到最优解的关键作用。
摘要由CSDN通过智能技术生成

题目链接:

http://poj.org/problem?id=1015


题目大意:

现在两个长度相等的序列, D P,现在要构造一个新的序列 A={a1,a2,a3ak} 使得 ki=1D[ai]ki=1P[ai] 尽量的小,如果有多解,要求 ki=1(D[ai]+P[ai]) 尽量的大。


解题过程:

历经两天才A掉的这个题,刚开始定义的三维的状态,果断超时了,后来建去以为,以当前差值的绝对值为状态,但是这样好像会失解,最后看了下博客,发现不用取绝对值可以了。

但是这题要求输出路径,于是纠结好久如何输出路径,要保证一个元素不难重复使用的话,只能从后往前递推,如何这样之前的路径就可能被之后更新掉,原因应该是,以这样DP,不符合最优子结构,全局最优解不是局部最优解,然后局部的解被更新掉之后,输出路径的时候就错了。

最后又去看了下博客,发现别人都是从前往后递推,并且转移的时候检查下当前元素有没有被用过。从前往后推的话,就能保证当前状态向后找的路径是确定不变的了。


题目分析:

定义状态 dp[i][j] ji=1D[ai]ji=1P[ai] 的结果为 i 时最大的ki=1D[ai]+P[ai]

那么状态之间转移为:
设当前已选的元素的集合为 D

dp[i+D[k]P[k]][j+1]=max(dp[i][j]+D[k]+P[k])1knkD

关键在于如何判断 kD ,这里只需要去递归访问路径,查看 k 是否在当前状态的路径中。

做这道题的时候,真的意识到写递推DP时计算顺序是多么重要,要考虑循环的嵌套顺序,是循环变量从前往后还是从后向前,一个不同,含义就改变了许多。


AC代码

#include <cstring>
#include <cstdio>
#include <vector>
#include <cmath>
#include <algorithm>
using namespace std;

const int INF = 0x3f3f3f3f;

int reserve1[3123][30], reserve2[3123][30];
int (*dp)[30] = reserve1+1512;
int (*pre)[30] = reserve2+1512;
int D[212], P[212];

//判断k是否已经被选择
bool is_select(int i, int j, int k) {
    while (~pre[i][j]) {
        int t = pre[i][j];
        if (t == k)
            return true;
        t = D[t]-P[t];
        i -= t;
        j--;
    }
    return false;
}

int main() {
    int n, m, cases = 0;
    while (~scanf("%d %d", &n, &m) && (n+m)) {
        for (int i = 0; i < n; i++) {
            scanf("%d %d", D+i, P+i);
        }
        memset(reserve1, 0x80, sizeof(reserve1));
        memset(reserve2, -1, sizeof(reserve2));
        //初始化边界状态
        dp[0][0] = 0;

        //记录答案
        int ans_diff, ans_sum;
        vector<int> ans_path;
        ans_diff = INF, ans_sum = -INF;

        for (int i = -1000; i <= 1000; i++) {
            for (int j = 0; j < m; j++) {
                //如果当前为负数,表示当前状态不可到达
                if (dp[i][j] < 0) continue;
                for (int k = 0; k < n; k++) {
                    int t1 = D[k]+P[k];
                    int t2 = D[k]-P[k];
                    if (!is_select(i, j, k) && (dp[i][j] + t1 > dp[i+t2][j+1])) {
                        dp[i+t2][j+1] = dp[i][j] + t1;
                        pre[i+t2][j+1] = k;
                        //当j等于m时更新答案
                        if (j+1 == m && (abs(i+t2) < abs(ans_diff) || abs(i+t2) == abs(ans_diff) && dp[i+t2][j+1] > ans_sum)) {
                            ans_diff = i+t2;
                            ans_sum = dp[i+t2][j+1];
                        }
                    }
                }
            }
        }

        int sum1, sum2;
        sum1 = sum2 = 0;
        int pos = m;
        //递归的去寻找路径
        while (~pre[ans_diff][pos]) {
            int t = pre[ans_diff][pos];
            ans_path.push_back(t);
            sum1 += D[t];
            sum2 += P[t];
            t = D[t]-P[t];
            ans_diff -= t;
            pos--;
        }

        sort(ans_path.begin(), ans_path.end());
        printf("Jury #%d\n", ++cases);
        printf("Best jury has value %d for prosecution and value %d for defence:\n", sum1, sum2);
        for (int i = 0; i < ans_path.size(); i++)
            printf(" %d", ans_path[i]+1);
        printf("\n\n");
    }
}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值