jzoj 3072 掷骰子 (概率dp)

Description

太郎和一只免子正在玩一个掷骰子游戏。有一个有N个格子的长条棋盘,太郎和兔子轮流掷一个有M面的骰子,骰子M面分别是1到M的数字.且掷到任意一面的概率是相同的.掷到几.就往前走几步.当谁走到第N格时,谁就获胜了。游戏中还有一个规则“反弹”.就是当一位选手要走到第N格外时.他就会后退(就像飞行棋进营一样)。

假设现在一位追手在A格.当他掷出B时:

1.A+B<N,走到第A+B格,

2.A+B=N,走到第N格,获胜。

3.A+B≥N,走到第(N-(A+B-N)格

现在太郎和兔子分别在第x和y格.接下来是太郎掷骰子,太郎想知道他赢得比赛的概率就多少。

100%的数据.10≤n≤ 2000,1≤m,x,y≤n-1



题解:概率dp

f[i][j] 表示太郎到达i,兔子到达j,太郎为先手,胜利的概率。

我们不妨从后往前dp

显然f[n][j]=1,f[i][n]=0;

那么f[n][n]呢,因为太郎是先手所以此时该太郎走,那么上一步就是兔子走的,所以上上步太郎到达的n,所以太郎必胜,f[n][n]=1;

对于剩下的情况,我们考虑分类讨论:

1。 i+m<=n,j+m<=n


对于这种情况我可以各自跳跃一步,走到后面已经推过的格子中直接累加后面所有胜利的概率,除以总的方案数即可。之所以可以这么推是因为这一步不会产生新的胜利状态。

2。i>n-m,j>n-m


进入到[n-m+1,n]这一段,就意味着进入了一种循环状态,我们跳过了又会跳回来,有可能无限的循环下去。

观察上面式子中的每一项,发现是一个公比为(1-1/m)^2 的等比数列,那么我们套用等比数列的求和公式

s+∞=a1/(1-p) p为公比,a1为序列的第一项。

3. i>n-m,j<=n-m


i可能有1/m的概率直接到达终点,同时如果在兔子没走这一步之前太郎就胜利了,那么推到当前步也一定是可以胜利的,是所以是(m-1)是因为新的胜利的状态我们已经单独考虑了。那么如果兔子也可以在当前步到达终点,是否需要考虑呢?不需要因为太郎是先手,我们只要在当前步到达终点,就胜利了。

4. i<=n-m,j>n-m


只有在i=n-m是太郎才能一步到达终点,考虑f[i+(1..m)][j]这是太郎为先手的胜利状态,所以在到达当前步之前我们要保证兔子走的那一步不能到达终点,所以是(m-1)

暴力dp是O(N^4),我们可以利用后缀矩阵优化将复杂度降为O(N^2)






  

#include<iostream>
#include<cstdio>
#include<algorithm>
#include<cmath>
#include<cstring>
#define N 2003
using namespace std;
double m,f[N][N];
int n,x,y;
double sum(int x,int y,int x1,int y1)
{
	double t=f[x][y]-f[x1][y]-f[x][y1]+f[x1][y1];
	//cout<<t<<endl;
	return t;
}
int main()
{
   freopen("dice.in","r",stdin);
   freopen("dice.out","w",stdout);
   scanf("%d%lf%d%d",&n,&m,&x,&y);
   for (int i=n;i>=1;i--)
    for (int j=n;j>=1;j--)
	{
		f[i][j]=f[i+1][j]+f[i][j+1]-f[i+1][j+1];
		if (i==n)
		{
			f[i][j]++;
			continue;
		}
	    if (j==n) continue;
	    if (i+m>n&&j+m>n)
	     f[i][j]+=1.0*m/(2.0*m-1.0);
	    if (i+m<=n&&j+m<=n)
	     f[i][j]+=(1.0/(m*m))*sum(i+1,j+1,i+m+1,j+m+1);
	    if (i>n-m&&j<=n-m)
	     f[i][j]+=((m-1)/(m*m))*sum(i,j+1,i+1,j+m+1)+1.0/m;
	    if (i<=n-m&&j>n-m)
	     f[i][j]+=((m-1)/(m*m))*sum(i+1,j,i+1+m,j+1)+(i==n-m)/(m*m);
	}
   /*for (int i=1;i<=n;i++)
   {
   	 for (int j=1;j<=n;j++)
   	  cout<<f[i][j]<<" ";
	 cout<<endl;
   }*/	
   printf("%0.6lf\n",sum(x,y,x+1,y+1));
}



评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值