SRM 628 D1L3:DoraemonPuzzleGame,math,后市展望,dp

称号:http://community.topcoder.com/stat?c=problem_statement&pm=13283&rd=16009

參考:http://apps.topcoder.com/wiki/display/tc/SRM+628

開始不知道怎么求期望。普通方法 p1*c1 + p2 *c2 + ... 行不通,看了Editoral才发现原来能够用dp的方法求期望,基本思想是令函数 f(t, r)为剩余 t 个 levels 还须要的花费的时间。r为一定须要获得2个stars的levels数量,则有:

当 t != r 时,须要获得one or two stars, f(t, r) = 1 + p0 * f(t, r) + p1 * f(t-1, r) + p2 * f(t-1, r-1). 解得 f(t, r) = ( 1 + p1 * f(t-1, r) + p2 * f(t-1, r-1) ) / (1 - p0).

当 t == r时,必须获得two stars, f(t, r) = 1 + (1 - p2) * f(t, r) + p2 * f(t-1, r-1). 解得 f(t, r) = ( 1 + p2 * f(t-1, r-1) ) / p2.

处理的顺序为按p2非递减就可以。

代码:

#include <algorithm>
#include <functional>
#include <numeric>
#include <utility>
#include <iostream>
#include <sstream>
#include <iomanip>

#include <bitset>
#include <string>
#include <vector>
#include <stack>
#include <deque>
#include <queue>
#include <set>
#include <map>

#include <cstdio>
#include <cstdlib>
#include <cctype>
#include <cmath>
#include <cstring>
#include <ctime>
#include <climits>
using namespace std;

#define CHECKTIME() printf("%.2lf\n", (double)clock() / CLOCKS_PER_SEC)
typedef pair<int, int> pii;
typedef long long llong;
typedef pair<llong, llong> pll;
#define mkp make_pair

/*************** Program Begin **********************/
const int MAX_N = 2001;
double dp[MAX_N][MAX_N];
class DoraemonPuzzleGame {
public:
	int N;
	vector <pair<double, double>> prob;
	double rec(int t, int r)
	{
		double & res = dp[t][r];
		// base case
		if (0 == t) {
			res = 0;
			return res;
		}
		if (res > -0.5) {
			return res;
		}
		res = 0.0;
		double p1 = prob[N - t].second;
		double p2 = prob[N - t].first;
		if (t != r) {	// get one or two stars int this level
			res = (1 + p1 * rec(t-1, r) + p2 * rec(t-1, max(0, r-1))) / (p1 + p2);
		} else {	// must get two stars
			res = (1 + p2 * rec(t-1, max(0, r-1))) / p2;
		}
		return res;
	}
	double solve(vector <int> X, vector <int> Y, int m) {
		N = X.size();
		for (int i = 0; i < MAX_N; i++) {
			for (int j = 0; j < MAX_N; j++) {
				dp[i][j] = -1.0;
			}
		}

		for (int i = 0; i < X.size(); i++) {
			prob.push_back(mkp(Y[i] / 1000.0, X[i] / 1000.0));
		}
		sort(prob.begin(), prob.end());
		
		return rec(N, m - N);
	}

};

/************** Program End ************************/


版权声明:本文博主原创文章,博客,未经同意不得转载。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值