题目一:题目链接
规则:
1. 爱丽丝可以从牌面为 [1,maxPts] 的牌中选择任意一张,这张牌是可以无限重复的。
2.如果她手上牌的总额小于 K,她就会抽牌,大于等于 K 时,就停止抽牌;
3.停止抽牌后,她的牌面小于等于 N 时,她就获胜了,求她获胜的概率。
假设 dp[x] 为爱丽丝手上牌面为x时,能获胜的概率,那么这个概
dp[x]=(1/maxPts) * (dp[x+1]+dp[x+2]+dp[x+3]…+dp[x+maxPts])
x分2种情况:
1.当x>=K时,爱丽丝会停止抽牌,这个时候游戏已经结束了,她是赢是输已经确定了,所以此时赢的概率要么1,要么0。(x>n时概率为0,x<=n概率为1)
2.当x<K时,爱丽丝会继续抽牌,抽牌是有概率的,所以她是赢是输也有概率。
她能抽到的牌面值在 [1,maxPts] 之间,所以抽完后她的牌面在[x+1,x+maxPts]之间,因为每张牌机率均等,所以抽完后牌面在[x+1,x+maxpPs]之间的每个面值概率都是相等的,而假如我们已知当牌面是[x+1,x+maxPts]的胜率(即dp[x+1]…dp[x+maxPts]的值),那么可以推导:
dp[x]=(1/maxPts) * (dp[x+1]+ dp[x+2] +dp[x+3]…+ dp[x+maxPts])
x 最多能到 K-1,因为当大于等于 K 时,爱丽丝会停止抽牌,所以当游戏结束时,即爱丽丝停止抽牌时,她可能达到的最大牌面是 K+maxPts-1,而一开始她的牌面是 0,所以我们用一个数组来保存她在所有面值下的胜率。而题目是要求爱丽丝从0开始抽牌,使用返回的值是dp[0];
double new21Game(int n, int k, int maxPts)
{
if(!k)
return 1.0;
double*dp=(double*)malloc(sizeof(double)*(k+maxPts));
for(int i=k;i<=k+maxPts-1;i++)
{
if(i<=n)
dp[i]=1;
else
dp[i]=0;
}
double sum=0;
for(int i=k;i<=k+maxPts-1;i++)
{
sum+=dp[i];
}
double l=1.0/maxPts;
for(int x=k-1;x>=0;x--)
{
dp[x]=sum*l;
sum=sum-dp[x+maxPts]+dp[x];
}
return dp[0];
}