[NOI2005]聪聪和可可:概率期望

首先观察数据范围,发现n\leqslant 1000,考虑以O(n^2)的时间复杂度预处理出go[i][j],表示当聪聪在点i,可可在点j时,聪聪下一步到达的点。我们可以从每个点i开始,通过一遍bfs求出go[i][\ ]。代码如下。

for(int i=1;i<=n;i++)
{
	memset(dis,0,sizeof(dis));
	head=tail=0,dis[i]=1,go[i][i]=i;
	for(int j=first[i];j;j=next[j])
	{
		dis[to[j]]=2;
		q[++tail]=go[i][to[j]]=to[j];
	}
	while(head<tail)
	{
		tmp=q[++head];
		for(r int j=first[tmp];j;j=next[j])
			if(!dis[to[j]])
			{
				q[++tail]=to[j];
				dis[to[j]]=dis[tmp]+1;
				go[i][to[j]]=go[i][tmp];
			}
			else if(dis[to[j]]==dis[tmp]+1&&go[i][to[j]]>go[i][tmp])
				go[i][to[j]]=go[i][tmp];//距离相同但编号更小时更新
	}
}

在bfs中,我们本来不需维护距离,但因为要满足距离相同编号最小的限制,只好顺便维护一下。重点来了:我们如何算出期望呢?最直接的想法自然是dfs。对于样例二,我们画出搜索树以便观察。可以发现,我们要统计的答案其实就是叶子结点的和。代码如下。

double dfs(int x,int y,int step,double p)
//step表示当前步数,p表示走到当前状态的概率
{
	if(x==y) return double(step-1)*p;
	//如果两者都还未移动就已经相遇,说明它们前一步就已经相遇,因此步数减1
	x=go[go[x][y]][y];//连走两步
	if(x==y) return double(step)*p;//可可不动的情况
	double ret=dfs(x,y,step+1,p/double(deg[y]+1));
	for(r int i=first[y];i;i=next[i])//枚举可可下一步的所有情况
		ret+=dfs(x,to[i],step+1,p/double(deg[y]+1));
	return ret;
}

然而超时了...我们来分析一下原因。设二元组(x,y)表示聪聪在点x,可可在点y的状态,共有1000^2中,按理说是不会超时的。然而应注意到,同一种状态可能被访问多次,什么意思呢?聪聪走的路是一定的,但可可则是完全随机的,它可能走了几种不同的路线,但最终到达相同的状态,如7-8-87-7-8两种路线的结果都是在第3步到达了点8,这样就导致了重复计算。因为相同的状态对答案有相同的贡献,我们可以记dp[i][j]表示聪聪在点i,可可在点j的状态对答案的贡献,并采取记忆化的方式避免重复计算。代码如下。

double dfs(int x,int y)
{
	if(vis[x][y]) return dp[x][y];
	vis[x][y]=1;
	if(x==y) return dp[x][y]=0;
	r int u=go[go[x][y]][y];
	if(u==y) return dp[x][y]=1;
	double ret=dfs(u,y);
	for(int i=first[y];i;i=next[i])
		ret+=dfs(u,to[i]);
	return dp[x][y]=ret/(deg[y]+1)+1;
}

至于算法的正确性,肯定与期望是线性函数有关,本蒟蒻也还在理解中...

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值