codeforces 331D 河狸boshi 【区间dp+期望】

题目大意

题目背景仅为报复boshi和jyf
有一只河狸叫boshi,有一天他在散步,来到了jyf的花园。
jyf在花园里种了n棵树,由于jyf有强迫症,所以他花园的的树种在一条直线上,都高为h。河狸boshi会随意选择最左边或者最右边的树啃倒,概率都为50%。在河狸boshi啃倒了一棵树之后,树可能向左或者向右倒,向左倒的概率是p,向右倒的概率是(1-p),如果一棵树倒的时候撞到了另一棵树(两棵树间的距离小于h),另一棵树也会倒。在所有树倒了以后,河狸boshi愉快地离开了jyf的花园。
jyf回到花园,记jyf的心痛值为他往种树的直线上看的时候,可以看到的树覆盖地面的长度,求jyf心痛值的期望。

题目分析

首先这题里最讨厌的地方是树倒可能会发生连锁反应。
不过我们可以预处理某棵树被boshi啃倒后向左最多波及到哪棵树,向右波及到哪棵,记为ld和rd。
然后用记忆化搜索。
不过我们单纯的把状态定位从i到j的区间里的树全倒了以后的期望是不够的,因为这些树倒了以后的期望还受它们两边的树是否向中间倒的影响,所以我们还要加两维z和y,表示第i-1和第j+1棵树是否向中间倒。
那么我们要分别考虑这四种情况:
1.boshi啃第i棵树,树向左倒。
2.boshi啃第i棵树,树向右倒。
3.boshi啃第j棵树,树向左倒。
4.boshi啃第j棵树,树向右倒。
同时我们也要考虑左边的树向左边倒和右边的树向右边倒,产生的覆盖长度与z和y的影响(见代码)。
好了,现在看第1和第4种情况,如果只考虑[i,j]这个区间的话,倒的树是单纯无害不会连累其他树的,其转移见代码。
再看第2和第3种情况,会影响其他树,又有两种情况:影响的树已经出了[i,j]区间和没有出,这个又要分别考虑,十分麻烦。。。
由于本蒟蒻语文成绩很烂,所以大家看代码吧(虽然代码也很丑)

代码

#include<cstdio>
#include<iostream>
#include<cstring>
#include<climits>
#include<algorithm>
using namespace std;
int n,h;double p;
int x[2005],ld[2005],rd[2005];
double f[2005][2005][2][2];
int vis[2005][2005][2][2];
double dp(int i,int j,int z,int y){//z和y:l-1和r+1是否向中间倒
    if(vis[i][j][z][y])return f[i][j][z][y];
    if(i>j)return 0;
    double re=0;
    int h1=min(h,x[i]-x[i-1]-h*z),h2=min(h,x[j+1]-x[j]-h*y);//i向左倒,j向右倒
    re+=0.5*p*(h1*1.0+dp(i+1,j,0,y));//左向左倒
    re+=0.5*(1.0-p)*(h2*1.0+dp(i,j-1,z,0));//右向右倒
    if(rd[i]>=j)re+=0.5*(1.0-p)*(x[j]-x[i]+h2)*1.0;//左向右倒
    else re+=0.5*(1.0-p)*(dp(rd[i]+1,j,1,y)+x[rd[i]]-x[i]+h)*1.0;
    if(ld[j]<=i)re+=0.5*p*(x[j]-x[i]+h1)*1.0;//右向左倒
    else re+=0.5*p*(dp(i,ld[j]-1,z,1)+x[j]-x[ld[j]]+h)*1.0;
    vis[i][j][z][y]=1,f[i][j][z][y]=re;
    return re;
}
int main()
{
    int i,j;
    scanf("%d%d%lf",&n,&h,&p);
    for(i=1;i<=n;i++)scanf("%d",&x[i]);
    sort(x+1,x+1+n);
    ld[1]=1;rd[n]=n;
    x[0]=-1000000005;x[n+1]=1000000005;//注意这个inf要开大一点
    for(i=2;i<=n;i++){
        ld[i]=i;
        if(x[i]-x[i-1]<h)ld[i]=ld[i-1];
    }
    for(i=n-1;i>=1;i--){
        rd[i]=i;
        if(x[i+1]-x[i]<h)rd[i]=rd[i+1];
    }
    printf("%.9lf",dp(1,n,0,0));
    return 0;
}
区间DP是一种动态规划的方法,用于解决区间范围内的问题。在Codeforces竞赛中,区间DP经常被用于解决一些复杂的字符串或序列相关的问题。 在区间DP中,dp[i][j]表示第一个序列前i个元素和第二个序列前j个元素的最优解。具体的转移方程会根据具体的问题而变化,但是通常会涉及到比较两个序列的元素是否相等,然后根据不同的情况进行状态转移。 对于区间长度为1的情况,可以先进行初始化,然后再通过枚举区间长度和区间左端点,计算出dp[i][j]的值。 以下是一个示例代码,展示了如何使用区间DP来解决一个字符串匹配的问题: #include <cstdio> #include <cstring> #include <string> #include <iostream> #include <algorithm> using namespace std; const int maxn=510; const int inf=0x3f3f3f3f; int n,dp[maxn][maxn]; char s[maxn]; int main() { scanf("%d", &n); scanf("%s", s + 1); for(int i = 1; i <= n; i++) dp[i][i] = 1; for(int i = 1; i <= n; i++) { if(s[i] == s[i - 1]) dp[i][i - 1] = 1; else dp[i][i - 1] = 2; } for(int len = 3; len <= n; len++) { int r; for(int l = 1; l + len - 1 <= n; l++) { r = l + len - 1; dp[l][r] = inf; if(s[l] == s[r]) dp[l][r] = min(dp[l + 1][r], dp[l][r - 1]); else { for(int k = l; k <= r; k++) { dp[l][r] = min(dp[l][r], dp[l][k] + dp[k + 1][r]); } } } } printf("%d\n", dp[n]); return 0; } 希望这个例子能帮助你理解区间DP的基本思想和应用方法。如果你还有其他问题,请随时提问。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值