Description
太郎和一只免子正在玩一个掷骰子游戏。有一个有N个格子的长条棋盘,太郎和兔子轮流掷一个有M面的骰子,骰子M面分别是1到M的数字.且掷到任意一面的概率是相同的.掷到几.就往前走几步.当谁走到第N格时,谁就获胜了。游戏中还有一个规则“反弹”.就是当一位选手要走到第N格外时.他就会后退(就像飞行棋进营一样)。
假设现在一位追手在A格.当他掷出B时:
1.A+B<N,走到第A+B格,
2.A+B=N,走到第N格,获胜。
3.A+B≥N,走到第(N-(A+B-N)格
现在太郎和兔子分别在第x和y格.接下来是太郎掷骰子,太郎想知道他赢得比赛的概率就多少。
100%的数据.10≤n≤ 2000,1≤m,x,y≤n-1
题解:概率dp
f[i][j] 表示太郎到达i,兔子到达j,太郎为先手,胜利的概率。
我们不妨从后往前dp
显然f[n][j]=1,f[i][n]=0;
那么f[n][n]呢,因为太郎是先手所以此时该太郎走,那么上一步就是兔子走的,所以上上步太郎到达的n,所以太郎必胜,f[n][n]=1;
对于剩下的情况,我们考虑分类讨论:
1。 i+m<=n,j+m<=n
对于这种情况我可以各自跳跃一步,走到后面已经推过的格子中直接累加后面所有胜利的概率,除以总的方案数即可。之所以可以这么推是因为这一步不会产生新的胜利状态。
2。i>n-m,j>n-m
进入到[n-m+1,n]这一段,就意味着进入了一种循环状态,我们跳过了又会跳回来,有可能无限的循环下去。
观察上面式子中的每一项,发现是一个公比为(1-1/m)^2 的等比数列,那么我们套用等比数列的求和公式
s+∞=a1/(1-p) p为公比,a1为序列的第一项。
3. i>n-m,j<=n-m
i可能有1/m的概率直接到达终点,同时如果在兔子没走这一步之前太郎就胜利了,那么推到当前步也一定是可以胜利的,是所以是(m-1)是因为新的胜利的状态我们已经单独考虑了。那么如果兔子也可以在当前步到达终点,是否需要考虑呢?不需要因为太郎是先手,我们只要在当前步到达终点,就胜利了。
4. i<=n-m,j>n-m
只有在i=n-m是太郎才能一步到达终点,考虑f[i+(1..m)][j]这是太郎为先手的胜利状态,所以在到达当前步之前我们要保证兔子走的那一步不能到达终点,所以是(m-1)
暴力dp是O(N^4),我们可以利用后缀矩阵优化将复杂度降为O(N^2)
#include<iostream>
#include<cstdio>
#include<algorithm>
#include<cmath>
#include<cstring>
#define N 2003
using namespace std;
double m,f[N][N];
int n,x,y;
double sum(int x,int y,int x1,int y1)
{
double t=f[x][y]-f[x1][y]-f[x][y1]+f[x1][y1];
//cout<<t<<endl;
return t;
}
int main()
{
freopen("dice.in","r",stdin);
freopen("dice.out","w",stdout);
scanf("%d%lf%d%d",&n,&m,&x,&y);
for (int i=n;i>=1;i--)
for (int j=n;j>=1;j--)
{
f[i][j]=f[i+1][j]+f[i][j+1]-f[i+1][j+1];
if (i==n)
{
f[i][j]++;
continue;
}
if (j==n) continue;
if (i+m>n&&j+m>n)
f[i][j]+=1.0*m/(2.0*m-1.0);
if (i+m<=n&&j+m<=n)
f[i][j]+=(1.0/(m*m))*sum(i+1,j+1,i+m+1,j+m+1);
if (i>n-m&&j<=n-m)
f[i][j]+=((m-1)/(m*m))*sum(i,j+1,i+1,j+m+1)+1.0/m;
if (i<=n-m&&j>n-m)
f[i][j]+=((m-1)/(m*m))*sum(i+1,j,i+1+m,j+1)+(i==n-m)/(m*m);
}
/*for (int i=1;i<=n;i++)
{
for (int j=1;j<=n;j++)
cout<<f[i][j]<<" ";
cout<<endl;
}*/
printf("%0.6lf\n",sum(x,y,x+1,y+1));
}