USACO 2018 December Contest Platinum T1: Balance Beam

题目大意

Bessie为了存钱给她的牛棚新建一间隔间,开始在当地的马戏团里表演,通过在平衡木上小心地来回走动来展示她卓越的平衡能力。

Bessie能够通过表演赚到的钱取决于她最终成功跳下平衡木的位置。平衡木上从左向右的位置记为 0,1,,N+1 。(2N1e5) 如果Bessie到达了位置 0 或是 N+1 ,她就会从平衡木的一端掉下去,遗憾地得不到报酬。

如果Bessie处在一个给定的位置 k ,她可以进行下面两项中的任意一项:

  1. 投掷一枚硬币。如果背面朝上,她前往位置 k1 ,如果正面朝上,她前往位置 k+1 (也就是说,每种可能性 1/2 的概率)。

  2. 跳下平衡木,获得 f(k) 的报酬(0f(k)1e9 )。

Bessie意识到她并不能保证结果能够得到某一特定数量的报酬,这是由于她的移动是由随机的掷硬币结果控制。然而,基于她的起始位置,她想要求出当她进行一系列最优的决定之后,她能够得到的期望报酬(“最优”指的是这些决定能够带来最高可能的期望报酬)。

例如,如果她的策略能够使她以 1/2 的概率获得 10 的报酬,1/4 的概率获得 8 的报酬,1/4 的概率获得 0 的报酬,那么她的期望报酬为加权平均值 10 * (1/2)+8 * (1/4)+0 * (1/4)=7 。

题目分析

对于给定的一个点我们要考虑的就是 跳下所得收益 和 移动后的收益期望,其中 跳下所得收益 已知,考虑如何求出 移动后的收益期望。

观察

显然,如果我们已知 某些节点x(令x∈A) 移动的期望收益比 它们的 停止收益低,即如果在 另一些点 进行移动操作,一旦移动到A中的点,最优的策略就是不再移动,称A中点为停止点。

 

如果从 点i 出发进行移动,那么移动的期望收益一定是由 i 前面第一个停止点和后面第一个停止点贡献的。

更具体地,设这两个停止点为 a, b, (a < i < b) 那么该 点i 的移动收益 Ei va * (b-i) / (b-a) + vb*(i-a) / (b-a)    (va, vb分别为a, b点跳下所得收益)

怎么得来的呢?

考虑设在 i 开始,到 停止的概率为 Fi,由题可得 F= (Fi-1 + Fi+1)/ 2,不难发现这个式子是等差数列的描述,又因为 F0=0, FL=1 可得 F

转载于:https://www.cnblogs.com/LI-dox/p/11216673.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值