Description
有n个游戏,互相独立,对于第i个游戏,每次玩有1-xi-yi的概率失败,xi的概率获得一颗星,yi的概率获得两颗星。对于每个游戏我们会记录你的历史最好成绩。
对于所有游戏,通关的条件为:所有游戏都有星,且总成绩至少有M颗星
求从0开始玩游戏,最优策略下的通关期望次数
n,m<=2000
Solution
感觉自己数学真差。。。QwQ
推了一个下午都没理解,晚上某个时候豁然开朗才写出来
首先最优策略肯定是:按y从小到大排序,从某个时刻i开始,以后的游戏都一定要玩到2星
那么我们就设Fi,j表示:前i个游戏,获得j颗星的概率,Gi,j表示期望步数
对于某一个游戏,获得星星的期望步数为1/(xi+yi),获得两颗星的期望步数为1/yi
达成1星的概率为xi/(xi+yi),达成2星的概率为yi/(xi+yi)
那么直接转移,维护一个期望步数的后缀和就好了
注意在某一步,如果对于ans有贡献,那么为了避免算重,计算完贡献之后要把这个位置的F和G清空
Code
#include <cstdio>
#include <cstring>
#include <algorithm>
#define fo(i,a,b) for(int i=a;i<=b;i++)
#define fd(i,a,b) for(int i=a;i>=b;i--)
using namespace std;
typedef double db;
const int N=2*1e3+5;
struct pty{db x,y;}a[N];
bool cmp(pty x,pty y) {return x.y<y.y;}
int n,m;
db f[N][N*2],g[N][N*2],suf[N],ans;
int main() {
scanf("%d%d",&n,&m);
fo(i,1,n) {
scanf("%lf%lf",&a[i].x,&a[i].y);
a[i].x/=1000.0;a[i].y/=1000.0;
}
sort(a+1,a+n+1,cmp);
fd(i,n,1) suf[i]=suf[i+1]+1/a[i].y;
if (n*2==m) {
printf("%.7lf\n",suf[1]);
return 0;
}
f[0][0]=1;
fo(i,1,n) {
db px=a[i].x/(a[i].x+a[i].y),py=a[i].y/(a[i].x+a[i].y);
db c=1/(a[i].x+a[i].y);
fo(j,1,n*2)
if ((n-i)*2>=m-j) {
f[i][j]+=f[i-1][j-1]*px;
if (j>1) f[i][j]+=f[i-1][j-2]*py;
g[i][j]+=(g[i-1][j-1]+c*f[i-1][j-1])*px;
if (j>1) g[i][j]+=(g[i-1][j-2]+c*f[i-1][j-2])*py;
if ((n-i)*2==m-j) {
ans+=g[i][j]+f[i][j]*suf[i+1];
f[i][j]=g[i][j]=0;
}
}
}
fo(i,m+1,n*2) ans+=g[n][i];
printf("%.7lf\n",ans);
}