【校内模拟】【JAG2015春季赛 C:Casino】炮轰社会报复者（概率论）（特征方程）（一大堆特判）

最新推荐文章于 2021-11-22 15:17:59 发布

zxyoi_dreamer

最新推荐文章于 2021-11-22 15:17:59 发布

阅读量182

点赞数 1

分类专栏：校内模拟

本文链接：https://blog.csdn.net/zxyoi_dreamer/article/details/101385381

版权

校内模拟专栏收录该内容

140 篇文章 0 订阅

订阅专栏

据说这道题JAG2015赛场上只有一个队AC。。。

题解：

设 $p$ 为一次赌博获胜的概率， $q$ 为 $1 - p$ ，即输的概率。

仔细思考一下发现实际上就是要我们对于 $i\in [1,m-1]$ 求一个决策表 $k_i$ ，表示当前有 $i$ 枚硬币的时候我们会赌 $k_i$ 枚硬币，显然这是一个马尔科夫过程，当前状态与之前的状态和决策无关。设 $p_i$ 表示当前有 $i$ 枚硬币，在将硬币输光之前能够赢到 $m$ 枚的概率，根据定义显然有：

$\begin{aligned} p_0&=0 \\p_i&=1,\forall i\geq m\\ p_i&=p\cdot p_{i+k_i}+q\cdot p_{i-k_i} ,\forall i\in [1,m-1] \end{aligned}$

显然 $p_i$ 是一个递增数列， $k_i\leq \min(i,m-i)$ 。

现在求不出 $k_i$ ，所以我们可以把限制写成：

$p_i=\max_{1\leq j\leq \min(i,m-i)}\{p\cdot p_{i+j}+ q\cdot p_{i-j}\}$

直接按照这个式子暴力迭代并特判 $p = 0$ 和 $p = 1$ 的情况可以得到35pts的好成绩。

接下来考虑对于特殊数据进行特殊处理：

1 . p = 0.5

首先明确一点，合法的 $p_i$ 序列唯一。

那么我们试图找一个序列 $p_i$ ，使得在 $p = 0.5$ 的时候满足上面的式子。

显然 $p_i=\frac{i}{m}$ 即可。此时每个 $p_i$ 都是 $p_{i+j}$ 和 $p_{i-j}$ 的平均值，则 $j\in[1,\min(i,m-i)]$ 的所有决策都是可行决策。

2 . p > 0.5

此时直觉告诉我们每次赌一枚硬币是最优的。。。

不要问我为什么，问就是打表找规律，而且日语官方题解也就写的是凭直觉。

如果要证明的话，日语官方题解是这样说的：

1 ドルずつ賭けるとして勝率を求め，
さっきの ?? の不等式を満たすことを示す

假设每次赌一枚硬币，求概率，满足前面的所有限制。

那么我们把概率求出来，发现是这样一个式子： $p_i=p\cdot p_{i+1}+q\cdot p_{i-1}$ ，也就是 $p\cdot p_{i+1}=p_i-q\cdot p_{i-1}$

利用特征方程可以把这个解出来，设 $r=\frac{q}{p}$ ，解出来是 $p_i=\frac{1-r^i}{1-r^m}$ ，这个形式就可以直接证明上述大于等于号成立了。

3 . p < 0.5

数学公式警告，长篇大论警告

这部分是这道题真正扯淡的地方。。。

也是这道题真正需要扯概率论的地方，为了保证你能够看懂下面的讲解，请补习鞅论（martingale）和停时理论（Optional Stopping Theorem）。~~其实不补也行，下面的可以感性理解。~~

设 $p c (i)$ 表示 $i$ 在表示成二进制数之后， $1$ 的个数

首先看一个问题，现在你有 $x$ 枚硬币，每次可以赌任意数量的硬币吗，赔率 $1 : 1$ ，赢的概率为 $p < 0.5$ ，你见好就收的上界为 $2^k$ ，问你在输光之前能否见好就收。

考虑这样一个策略，每次赌 $2^l$ ，其中 $2^l$ 是最大的能够整除 $x$ 的 $2$ 的整数次幂，也就是所谓的lowbit。

这个策略下初始硬币数为 $x$ 的胜率为： $f(x)=\sum\limits_{i=0}^{x-1}q^{pc(i)}p^{k-pc(i)}$

或者说，设 $x$ 的二进制拆分为 $x=\sum\limits_{i=1}^{k}b_i2^{k-i}$ ，则 $f(x)=\sum\limits_{i=1}^{k}b_ip^{i-\sum\limits_{j=1}^{i-1}b_j}q^{\sum\limits_{j=1}^{i-1} b_j}$ ，然后由这个式子可以导出上面那个式子。

证明随便归纳一下就行了。

可以证明 $f (x)$ 是所有策略中的上鞅，考虑赌 $k$ 枚硬币，上鞅的意思就是说下面这个式子始终成立，~~我尽量解释得通俗了~~： $f(x)\geq f(x+k)\cdot p+f(x-k)\cdot q$

重写上面的命题，也就是 $q\cdot (f(x)-f(x-k))\geq p\cdot (f(x+k)-f(x))\\ \Longleftrightarrow\sum_{i=x-k}^{x-1}q^{pc(i)+1}p^{k-pc(i)}\geq \sum_{i=x}^{x+k-1}q^{pc(i)}p^{k-pc(i)+1}$

考虑在两个集合中构建双向映射来证明上面的式子， $\{x-k,\cdots x-1\}\Leftrightarrow\{x,\cdots,x+k-1\}$ ，使得 $\forall a\in[x-k,x-1],\exist b\in[x,x+k-1]$ ，有 $pc(a)+1\geq pc(b)$ ，则 $q^{pc(a)+1}p^{k-pc(i)}\geq q^{pc(b)}p^{k-pc(i)+1}$ ，全部加起来即可证明上式。

怎么构造上面那个双向映射，找到最小的 $s$ ，满足 $s\geq k$ 且 $s$ 是 $2$ 的整数次幂。然后将 $x - k$ 与 $x - k + s$ 配对， $x - k + 1$ 与 $x - k + s + 1$ 配对，以此类推，注意到 $s\leq 2k$ 所以我们能够至少成功匹配一对，将 $k$ 设置成 $s - k$ 继续配对，显然能够构成一个完备匹配。
显然由于只在一个二进制位上 $+ 1$ ，这个构造能够满足上面的限制，如果有进位更好，二进制位的 $1$ 只会变少不会变多。

$f (x)$ 是所有策略的上鞅得证。

由停时理论可以知道 $f (x)$ 是最优策略。

显然我们可以将 $x$ 变为 $\frac{x}{2^k}$ ，将 $2^k$ 变为 $1$ 做同等意义下的赌博，设此时答案为 $g (x)$ 。

也就是说我们能够直接处理 $2$ 进制有限小数的情况，将 $x$ 写成二进制小数的形式： $0.b_1b_2\cdots b_k$ ，结论和上面的相同。

如果 $x$ 是二进制无限小数，设 $x_k$ 表示 $x$ 截断前 $k$ 位得到的有限小数，我们直接将 $x_k$ 的策略用到 $x$ 上不会差，因为 $x>x_k$ 。我们可以这样将 $k$ 向无穷大靠近来逼近真实值，由于这个乘积是收敛的，所以可以直接算，在当前乘积小于精度的时候break掉。（其实如果 $m$ 再小一点我们可以直接开一个vis数组求循环节，由于几何级数收敛能够求出精确值，~~于是这道题可以扔到取模的环境下改成毒瘤题了~~）这种情况下的 $g(x)=\sum\limits_{i=1}^\infty b_ip^{i-\sum\limits_{j=1}^{i-1}b_j}q^{\sum\limits_{j=1}^{i-1} b_j}$

$f (x)$ 是针对离散游戏， $g (x)$ 很显然是针对连续游戏。

$g (x)$ 是这个连续游戏的上鞅，可以根据 $f (x)$ 是离散游戏的上鞅加上调整法来证明。由停时理论，同样 $g (x)$ 是最优决策下的获胜概率。

算答案的话直接将 $x=\frac{n}{m}$ 的二进制表示倒出来一下，然后用 $g (x)$ 来算就行了，注意最坏情况下循环节长度是 $O(\phi(m))$ 的，无法承受，在精度爆炸的时候直接break掉就行了。

现在问题就只剩下哪些是 $x = n$ 的时候第一步的可能最优决策。

现在上面那个关于 $f$ 的取最小的2的整数次幂的结论用不了了，因为 $\frac{n}{m}$ 可能是二进制无限循环小数。

考虑一个贪心策略，每次赌 $\min(n,m-n)$ ，这个显然是一个最优策略，证明可以考虑调整法。设 $r=\frac{q}{p}，r > 1$ 。关于 $g (x)$ ，我们有如下的关系式：

$\begin{aligned} g(x)&=p+qg(2x-1),x\geq \frac{1}{2}\\ g(x)&=p\cdot g(2x),x < \frac{1}{2}\\ \end{aligned}$

设 $r=\frac{q}{p},x=\sum\limits_{i}2^{b_i}$ ， $b_i$ 允许为负数，上面的一大堆式子可以改写成：

$\begin{aligned} g(x)&=\sum_{i}r^i(1+r)^{b_i}\\ (r+1)g(x)&=1+rg(2x-1),x\geq \frac{1}{2}\\ (r+1)g(x)&=g(2x),x < \frac{1}{2} \end{aligned}$

我来人工翻译一下官方题解接下来的的叙述，~~各大翻译网站对于学术语句的日翻中都难以直视~~，事实证明会一点日语还是有用的，~~多亏了平时看番~~。

接下来的推导看到 $f$ 请自动认为是 $g$ ，官方题解用的 $f$ ，我用的 $g$ ，翻译的时候难免会有纰漏。

考虑证明 $g(x+y)\geq g(x)+r\cdot g(y),(x\geq y\geq 0)$

设 $x$ 最高位为 $2^{e_0}$ ， $x=2^{e_0}+x'$ ，则 $g(x)=(r+1)^{e_0}+rg(x')$ ，接下来对 $y$ 的值分类讨论，~~看掉一个“ない”把我懵逼了半天~~：

$y$ 的最高位也是 $2^{e_0}$ 的情况，
设 $y=2^{e_0}+y'$ ，则 $g(x+y)-g(x)-r\cdot g(y)=r(g(x'+y')-g(x')-r\cdot g(y'))$ ，显然 $y'\leq x'$ ，归纳证明即可。
$y$ 的最高位低于 $2^{e_0}$ ，且 $x, y$ 相加进位到了 $2^{e_0+1}$ 。
以下两式成立：
$g(x+y)-g(x)-r\cdot g(y)=(r-1)((r+1)^{e_0}-g(x'))+g(x'+y)-g(x')-rg(y)\\ g(x+y)-g(x)-r\cdot g(y)=(r-1)((r+1)^{e_0}-g(y))+g(x'+y)-g(x)-rg(x')$
$y$ 的最高位低于 $2^{e_0}$ ，且 $x, y$ 相加没有进位到 $2^{e_0+1}$
以下两式成立：
$g(x+y)-g(x)-r\cdot g(y)=r(r-1)g(y)+r(g(x'+y)-g(x')-rg(y))\\ g(x+y)-g(x)-r\cdot g(y)=r(r-1)g(x')+r(g(x'+y)-g(y)-rg(x'))$

关于上面的式子，显然有 $(r+1)^{e_0}-g(x') > 0,(r+1)^{e_0}-g(y) > 0,g(x')\geq 0,g(y)\geq 0$ 。由于我们在2,3情况中并不清楚 $x^{'}$ 和 $y$ 的大小，所以上面的两个等式我们需要选择一个递归。如果 $x, y$ 都是二进制无限循环小数，则归纳会陷入循环，设 $L$ 表示循环节长度的 $l c m$ ，对于任意 $0\leq l\leq L$ ，可以轻易得到：

$g(x_1+y_1)-g(x_1)-r\cdot g(y_1)\geq r^l(g(x_1/2^L+y_1/2^L)-g(x_1/2^L)-r\cdot g(y_1/2^L))$

由于 $r > 1$ ，可以得到 $g(x_1+y_1)-g(x_1)-r\cdot g(y_1)\geq 0$ ，也就是 $g(x+y)\geq g(x)+r\cdot g(y)$ 。

要求等号成立，则中间产生的 $r+1)^{e_0}-g(x'),(r+1)^{e_0}-g(y),g(x'),g(y)$ 必须全部为0。

考虑一个决策 $d$ ，如果它是最优决策，则 $g(\frac{n}{m})=p\cdot g(\frac{n+d}{m})+q\cdot g(\frac{n-d}{m})$ ，两边乘个 $r + 1$ 可以得到 $(r+1)g(\frac{n}{m})=g(\frac{n+d}m)+rg(\frac{n-d}{m})$ ，利用 $g (x)$ 的两个递推式可以知道解的分布。

将 $\frac{n}{m}$ 二进制拆分，对于所有合法的如下表示 $\frac{n}{m}=2^{e+2}a+2^e+b$ ，即第 $e + 1$ 位为空。则可能合法的 $d$ 有 $(2^e\pm b)*m$ ，直接一路取模的同时把答案搞出来就行了。

代码：

#include<bits/stdc++.h>
#define ll long long
#define re register
#define cs const

using std::cerr;

int n,m,P;

namespace Solve_Special{
	inline void main(){
		int res=P==50?std::min(n,m-n):n;
		printf("%.8f\n%d\n",P==50?1.0*n/m:1e-2*P,res);
		if(res<=200)for(int re i=1;i<=res;++i)printf("%d ",i);
		else {
			for(int re i=1;i<=100;++i)printf("%d ",i);
			for(int re i=99;~i;--i)printf("%d ",res-i);
		}
	}
}

namespace Solve_Greater{
	inline void main(){
		double p=P*1e-2,q=1-p,r=q/p;
		double res=(1-pow(r,n))/(1-pow(r,m));
		printf("%.8f\n1\n1",res);
	}
}

namespace Solve_Less{
	int a[107],cnt;
	inline void main(){
		double res=0,cur=1,p=P*1e-2,q=1-p;
		for(int w=n<<1;w&&cur>1e-8;w<<=1)
		if(w>=m){res+=cur*p;w-=m;cur*=q;}
		else cur*=p;
		printf("%.8f\n",res);
		while(n){a[++cnt]=std::min(n,m-n);if(m&1)break;n%=m>>=1;}
		std::sort(a+1,a+cnt+1);cnt=std::unique(a+1,a+cnt+1)-a-1;
		printf("%d\n",cnt);
		for(int re i=1;i<=cnt;++i)printf("%d ",a[i]);
	}
}

signed main(){
#ifdef zxyoi
	freopen("revenge.in","r",stdin);
#endif
	scanf("%d%d%d",&P,&n,&m);
	if(P==0||P==100||P==50)Solve_Special::main();
	else if(P<50)Solve_Less::main();
	else if(P>50)Solve_Greater::main();
	else assert(0);
	return 0;
}