很明显可以期望dp,状态表示为 f[a][b][c][d][x][y](abcd表示四种花色牌的数量,x和y表示大小王,如果不记录大小王翻开后充当了那个花色太容易出错,所以用四种状态表示充当了那个花色,所以x和y取值0到4)
需要注意的是牌的数量是可以大于A,B,C,D的。还有翻到大小王之后具体是充当哪个花色是由你自己决定的,和概率无关,既然要求最小的期望值就选择期望值最小的状态转移即可。
#include<bits/stdc++.h>
using namespace std;
typedef long long ll;
const int N=16;
int A,B,C,D;
double f[N][N][N][N][5][5];
int main()
{
cin>>A>>B>>C>>D;
if(max(A-13,0)+max(0,B-13)+max(0,C-13)+max(0,D-13)>2)
{
puts("-1.000");
return 0;
}
for(int a=13;a>=0;--a)
for(int b=13;b>=0;--b)
for(int c=13;c>=0;--c)
for(int d=13;d>=0;--d)
for(int x=4;x>=0;--x)
for(int y=4;y>=0;--y)
{
//终止状态
if(a+(x==1)+(y==1)>=A&&b+(x==2)+(y==2)>=B&&c+(x==3)+(y==3)>=C&&d+(x==4)+(y==4)>=D) continue;
int cnt=a+b+c+d+(x>0)+(y>0);
f[a][b][c][d][x][y]=1;
if(a<13) f[a][b][c][d][x][y]+=f[a+1][b][c][d][x][y]*(13-a)/(54-cnt);
if(b<13) f[a][b][c][d][x][y]+=f[a][b+1][c][d][x][y]*(13-b)/(54-cnt);
if(c<13) f[a][b][c][d][x][y]+=f[a][b][c+1][d][x][y]*(13-c)/(54-cnt);
if(d<13) f[a][b][c][d][x][y]+=f[a][b][c][d+1][x][y]*(13-d)/(54-cnt);
if(x==0)
{
double res=1e18;
for(int i=1;i<=4;++i)
(f[a][b][c][d][i][y]/(54-cnt));
f[a][b][c][d][x][y]+=res;
}
if(y==0)
{
double res = 1e18;
for(int i=1;i<=4;++i)
res=min(res,f[a][b][c][d][x][i]/(54-cnt));
f[a][b][c][d][x][y]+=res;
}
}
printf("%.3lf",f[0][0][0][0][0][0]);
return 0;
}