调了一下午QAQ…让我对数学期望的理解又提升了一个层次。
首先,我们发现
v
<
=
300
v<=300
v<=300 , 这样我们就可以用
F
l
o
y
d
Floyd
Floyd 算法来
O
(
n
3
)
O(n^3)
O(n3) 处理出任意两点间的最短路。
对于题目,我们不难列出状态
d
p
[
i
]
[
j
]
[
0
/
1
]
dp[i][j][0/1]
dp[i][j][0/1]。
这个状态代表:走到第
i
i
i个点,用了
j
j
j次机会,当前使用了(0表示未使用,1表示使用)机会的最小期望值。
首先,我们考虑
d
p
[
i
]
[
j
]
[
0
]
dp[i][j][0]
dp[i][j][0],那么上一个点可能使用了机会,也可能未使用机会。
不难列出未使用机会的方程:
d p [ i ] [ j ] [ 0 ] = d p [ i − 1 ] [ j ] [ 0 ] + f [ c i − 1 ] [ c i ] dp[i][j][0]=dp[i-1][j][0]+f[c_{i-1}][c_{i}] dp[i][j][0]=dp[i−1][j][0]+f[ci−1][ci]
那么对于上一次使用了机会,方程应为:
d p [ i ] [ j ] [ 0 ] = d p [ i − 1 ] [ j ] [ 1 ] + f [ c i − 1 ] [ c i ] ∗ ( 1 − k [ i − 1 ] ) + f [ d i − 1 ] [ c i ] ∗ k [ i − 1 ] dp[i][j][0]=dp[i-1][j][1] + f[c_{i-1}][c_{i}] * (1 - k[i-1]) + f[ d_{i-1}][c_{i}] * k[i-1] dp[i][j][0]=dp[i−1][j][1]+f[ci−1][ci]∗(1−k[i−1])+f[di−1][ci]∗k[i−1]
体会一下,上一次使用机会的话会面临两种情况:
1.交换成功,路程为
f
[
d
i
−
1
]
[
c
i
]
f[d_{i-1}][c_{i}]
f[di−1][ci],概率为
k
[
i
−
1
]
k[i-1]
k[i−1].
2.未交换成功,路程为
f
[
c
i
−
1
]
[
c
i
]
f[c_{i-1}][c_{i}]
f[ci−1][ci],概率为
1
−
k
[
i
−
1
]
1-k[i-1]
1−k[i−1].
再考虑一下当前使用机会,分6种情况。
1.上一轮未交换,当前交换失败:路程为
f
[
c
i
−
1
]
[
c
i
]
f[c_{i-1}][c_{i}]
f[ci−1][ci],概率为
1
−
k
[
i
]
1-k[i]
1−k[i]
2.上一轮未交换,当前交换成功:路程为
f
[
c
i
−
1
]
[
d
i
]
f[c_{i-1}][d_{i}]
f[ci−1][di],概率为
k
[
i
]
k[i]
k[i]
3.上一轮交换失败,当前交换失败,路程为
f
[
c
i
−
1
]
[
c
i
]
f[c_{i-1}][c_{i}]
f[ci−1][ci],概率为
(
1
−
k
[
i
−
1
]
)
∗
(
1
−
k
[
i
]
)
(1-k[i-1])*(1-k[i])
(1−k[i−1])∗(1−k[i])
4.上一轮交换失败,当前交换成功,路程为
f
[
c
i
−
1
]
[
d
i
]
f[c_{i-1}][d_{i}]
f[ci−1][di],概率为
(
1
−
k
[
i
−
1
]
)
∗
k
[
i
]
(1-k[i-1])*k[i]
(1−k[i−1])∗k[i]
5.上一轮交换成功,当前交换失败,路程为
f
[
d
i
−
1
]
[
c
i
]
f[d_{i-1}][c_{i}]
f[di−1][ci],概率为
k
[
i
−
1
]
∗
(
1
−
k
[
i
]
)
k[i-1]*(1-k[i])
k[i−1]∗(1−k[i])
6.上一轮交换成功,当前交换成功,路程为
f
[
d
i
−
1
]
[
d
i
]
f[d_{i-1}][d_{i}]
f[di−1][di],概率为
k
[
i
−
1
]
∗
k
[
i
]
k[i-1]*k[i]
k[i−1]∗k[i]
最后将所有信息合并即可,另外细节巨多,到注意初始化。
Code:
#include<cstdio>
#include<algorithm>
#include<cstring>
using namespace std;
const int maxn = 350;
const int N = 2000 + 5;
const double inf = 1000000000;
int f[maxn][maxn], c[N], d[N], n,m,v,e;
double k[N], dp[N][N][2];
inline void update(double &a, double b){ if(b < a) a = b;}
int main()
{
scanf("%d%d%d%d",&n,&m,&v,&e);
for(int i = 1;i <= n; ++i) scanf("%d",&c[i]);
for(int i = 1;i <= n; ++i) scanf("%d",&d[i]);
for(int i = 1;i <= n; ++i) scanf("%lf",&k[i]);
for(int i = 1;i <= v; ++i) for(int j = 1;j <= v; ++j) f[i][j] = f[j][i] = inf;
for(int i = 1;i <= e; ++i)
{
int a,b,c;
scanf("%d%d%d",&a,&b,&c);
f[a][b] = f[b][a] = min(f[a][b], c);
}
for(int i = 0;i <= v; ++i) f[i][0] = f[0][i] = f[i][i] = 0;
for(int k = 1;k <= v; ++k)
for(int i = 1;i <= v; ++i)
for(int j = 1;j <= v; ++j)
if(f[i][k] != inf && f[k][j] != inf)f[i][j] = min(f[i][j], f[i][k] + f[k][j]);
for (int i = 0; i <= n; ++i)
for (int j = 0; j <= m; ++j)dp[i][j][0] = dp[i][j][1] = inf;
dp[1][0][0] = dp[1][1][1] = dp[0][0][0] = 0;
for(int i = 1;i <= n; ++i)
{
dp[i][0][0] = dp[i-1][0][0] + f[c[i-1]][c[i]];
for(int j = 1;j <= min(i,m); ++j)
{
update(dp[i][j][0], dp[i-1][j][0] + f[c[i-1]][c[i]]);
update(dp[i][j][0], dp[i-1][j][1] + f[c[i-1]][c[i]] * (1 - k[i-1]) + f[d[i-1]][c[i]] * k[i-1]);
if(j >= 1)
{
double tmp = 0.0;
update(dp[i][j][1], dp[i-1][j-1][0] + f[c[i-1]][d[i]] * k[i] + f[c[i-1]][c[i]] * (1 - k[i]));
tmp = dp[i-1][j-1][1];
tmp += f[c[i-1]][c[i]] * (1 - k[i-1]) * (1 - k[i]);
tmp += f[d[i-1]][c[i]] * k[i-1] * (1 - k[i]);
tmp += f[c[i-1]][d[i]] * (1 - k[i-1]) * k[i];
tmp += f[d[i-1]][d[i]] * k[i-1] * k[i];
update(dp[i][j][1], tmp);
}
}
}
double ans = inf;
for(int j = 0;j <= m; ++j)
{
update(ans, dp[n][j][0]);
update(ans, dp[n][j][1]);
}
printf("%.2f",ans);
return 0;
}