概率dp
这是dp的一类题。主要是概率和动态规划结合题目,话不多说,直接上题;
传送门:
https://www.nowcoder.com/practice/8b8c4fc44b614862b2a4f53771577995?tpId=90&tqId=30855&tPage=4&rp=4&ru=/ta/2018test&qru=/ta/2018test/question-ranking
解析
一看到这种题,显然直接求显然是不可能的,而且也很难讨论。所以这一类的题的解题思路一般是采用dp的求解形式。 既然是要dp,你总得有状态转移方程吧。So,对于这种概率dp可以考虑每次操作的过程,我们只需要关注小明就行了,首先,小明每次要么拿最上面的数,要么拿最下面的数。假设只有一个数,那没什么好说的,小明直接拿走就game over了,有两个数时,小明能拿到的数期望为
p
⋅
a
i
+
(
1
−
p
)
⋅
a
i
+
1
p\cdot a_i+(1-p)\cdot a_{i+1}
p⋅ai+(1−p)⋅ai+1 这个很容易就知道了。那么接下来就是重点了,因为是序列,所以我们可以假设
d
p
[
i
]
[
j
]
dp[i][j]
dp[i][j]表示从第
i
i
i个数到第
j
j
j个数小明能拿的数的期望,那么这个转移怎么写了,这就需要参考前面两个数的过程了,当
n
>
2
n>2
n>2时,即进行完上一过程后,后面的过程是紧接着前面的过程中。当小明拿完一次后,剩下的状态就为
d
p
[
i
+
1
]
[
j
]
,
d
p
[
i
]
[
j
−
1
]
dp[i+1][j],dp[i][j-1]
dp[i+1][j],dp[i][j−1], 哪一个状态是和他的概率有关的,然后就是小方拿的了,显然小方和小明是没什么区别的,除了那个拿的概率不一样,小方每次拿之后又是另外两种状态,剩下的状态又是小明拿的解了,就可以直接当作答案了,所以概率的转移方程可以写成
d
p
[
i
]
[
j
]
=
p
⋅
(
a
i
+
q
⋅
d
p
[
i
+
2
]
[
j
]
+
(
1
−
q
)
⋅
d
p
[
i
+
1
]
[
j
−
1
]
)
+
(
1
−
p
)
⋅
(
a
j
+
q
⋅
d
p
[
i
+
1
]
[
j
−
1
]
+
(
1
−
q
)
⋅
d
p
[
i
]
[
j
−
2
]
)
dp[i][j]=p\cdot (a_i+q\cdot dp[i+2][j]+(1-q)\cdot dp[i+1][j-1])+(1-p)\cdot (a_j+q\cdot dp[i+1][j-1]+(1-q)\cdot dp[i][j-2])
dp[i][j]=p⋅(ai+q⋅dp[i+2][j]+(1−q)⋅dp[i+1][j−1])+(1−p)⋅(aj+q⋅dp[i+1][j−1]+(1−q)⋅dp[i][j−2])
AC代码
// 小学生一发的刷题之路
//
// Mannacher Algorithm
//
//
#include <iostream>
#include <cstdio>
#include <string>
#include <cstring>
#include <algorithm>
#include <queue>
#include <deque> //双向队列;
#include <cmath>
#include <set>
#include <stack>
#include <map>
#include <vector>
#include <cstdlib>
#include <iomanip>
using namespace std;
typedef long long ll;
typedef unsigned long long ull;
typedef long double ld;
const double PI=acos(-1.0);
const double eps=1e-8;
const int maxn=1e3+5;
const int maxm=1e3+5;
const ll mod=1e9+7;
const int INF=1e8;
template<class T>
inline void read(T &ret){ //快速输入模版;
ret=0;
int f=1;
char c=getchar();
while(c<'0'||c>'9'){
if(c=='-') f=-1;
c=getchar();
}
while(c>='0'&&c<='9'){
ret=ret*10+c-'0';
c=getchar();
}
ret*=f;
}
template <class T>
inline void out(T ret){ //快速输出模版;
if(ret>9)
{
out(ret/10);
}
putchar(ret%10+'0');
}
double a[maxn],dp[maxn][maxn];
int main()
{
int n,P,Q;
scanf("%d %d %d",&n,&P,&Q);
double p=(double)P/100.0;
double q=(double)Q/100.0;
for(int i=1;i<=n;i++){
scanf("%lf",&a[i]);
}
for(int i=1;i<=n;i++){ //区间长度为1时;
dp[i][i]=a[i];
}
for(int i=1;i<n;i++){ //区间长度为2时;
dp[i][i+1]=p*a[i]+(1-p)*a[i+1];
}
//dp[i][j]表示从[i,j]区间里小明能拿的数的期望;
//dp[i][j]=p*(a[i]+q*dp[i+2][j]+(1-q)*dp[i+1][j-1]))
//+(1-p)*(a[j]+q*dp[i][j-2]+(1-q)*dp[i+1][j-1]); //即当前拿的地方以及剩下位置的情况;
for(int len=2;len<n;len++){
for(int i=1;i<=n-len;i++){
int j=i+len;
dp[i][j]=p*(a[i]+q*dp[i+2][j]+(1-q)*dp[i+1][j-1])+
(1-p)*(a[j]+q*dp[i+1][j-1]+(1-q)*dp[i][j-2]);
}
}
printf("%0.3lf\n",dp[1][n]);
return 0;
}
新的开始,每天都要快乐哈!