他有2种决策:①停留在这个城市5分钟;②如果城市i与现在所在城市相邻,且能在走到i后还能把剩下的城市遍历,则称i为EJ。在当前城市如果有cnt个EJ,那么他选择走向每个EJ的概率和停留在该城市的概率均为1/(cnt+1)
求小偷遍历完城市所需时间的期望值
题解:期望dp,考虑到n<=15,可以用状态压缩,dp[u][S]表示遍历的状态为S,当前城市为u的期望值。先预处理出每个状态下EJ的个数cnt,以及从当前的状态开始是否能遍历整个图mp,预处理和DP时注意用记忆化搜索
#include<bits/stdc++.h>
using namespace std;
typedef pair<int,int> PII;
const int MX = (1<<15)+10;
double dp[16][MX],cnt[16][MX];
int n,mx,tot,head[16];
const double eps=1e-12;
struct Edge{
int v,c,nxt;
}edge[MX];
void add(int u,int v,int c){
edge[tot].v=v;
edge[tot].c=c;
edge[tot].nxt=head[u];
head[u]=tot++;
}
bool mp[16][MX];
int dfs(int u,int S){
if(S==mx||mp[u][S]) return mp[u][S]=1;
for(int i=head[u];~i;i=edge[i].nxt){
int v=edge[i].v;
if(((S>>v)&1)==1||!dfs(v,S|(1<<v))) continue;
mp[u][S]=1;
cnt[u][S]++;
}
return mp[u][S];
}
double DP(int u,int S){
if(S==mx||cnt[u][S]==0) return 0;
if(dp[u][S]>0) return dp[u][S];
double p=1/(cnt[u][S]+1);
for(int i=head[u];~i;i=edge[i].nxt){
int v=edge[i].v;
if(((S>>v)&1)==1||mp[v][S|(1<<v)]==0) continue;
dp[u][S]+=(DP(v,S|(1<<v))+edge[i].c)*p;
}
dp[u][S]+=5.0*p;
dp[u][S]/=(1-p);
return dp[u][S];
}
int main(){
int T,m;
// freopen("in.txt","r",stdin);
scanf("%d",&T);
for(int cas=1;cas<=T;cas++){
memset(head,-1,sizeof(head));
memset(mp,0,sizeof(mp));
memset(cnt,0,sizeof(cnt));
memset(dp,0,sizeof(dp));
tot=0;
scanf("%d%d",&n,&m);
mx=(1<<n)-1;
for(int i=0;i<m;i++){
int u,v,w;
scanf("%d%d%d",&u,&v,&w);
add(u,v,w);
add(v,u,w);
}
dfs(0,1);
printf("Case %d: %.12f\n",cas,DP(0,1));
}
return 0;
}