最优停止理论OptimalStoppingTheory经典秘书问题ClassicSecretaryProblem

在博弈论中,类似问题,有相亲问题、见好就收、苏丹嫁妆问题、挑剔的求婚者问题等 。首先通俗解下类似问题:相亲问题,售房问题。

       相亲问题描述如下:

       假如一个非常优秀的人相亲,已知追求的他的人有有限个,例如10位,并且根据个人的评价,给这10个人给予了综合打分。现在规定,交往中他不能脚踏两只船,即不能同时和两个人交往,如果在交往之后他没有接受这个人,那么,以后也没有机会再选择这个人作为对象。然后接着和下一个人交往。

       这个问题可以看出,无论什么时候选择都会面临很多不确定性,比如无法预知是否错过了最优秀的人选,或者在选择后,后面会不会有更好的人选。那么,他随机和这些人交往,在和第几个人交往时,他能选择到最优秀的人作为对象呢,即何时停止交往可以使他选择到最优秀的人最为对象呢?

下面是停止规则的一般归纳,它是通过两个对象来定义的:

      (1)一系列随机变量X1,X2,…,它们的联合分布规律是已知的,

      (2)一系列奖励函数Y0,Y(X1),Y(X1,X2),…

       在考虑这两个对象时,你可以一直观察随机变量X1,X2… 在观察变量Xn时,你可能会选择停止,这个时候你获得的奖励是函数Yn(X1,X2,X3…,Xn),当然这个函数值也可能是负数,比如女青年相求问题,加入相亲了N个人(N很大),那么她会经历从“剩斗士”到“必剩客”再到“齐天大剩”的过程,想想,还是很吃亏的(不仅木有回报,并且逝去了最美丽的年华)~~你也可能是持续观察下一次的过程,记为N 趋于无穷大,那么这时候也有一个对应的回报函数值。现在要解决的问题是,在何时停止观察随机变量x,可以是我们的回报函数值最大。

       这里给出了理想的情况下,如何求解经典秘书问题:

       问题描述:要聘请一名秘书,有n人来面试,n是已知的,而且面试者的能力有排名,随机进行面试,每个人的机会是均等的。每次面试一人,面试官便要即时决定聘不聘他,如果当时决定不聘他,他便不会回来。面试时总能清楚了解求职者的适合程度,并能和之前的每个人作比较。问凭什么策略,才使选得到最适合担任秘书的人的机率最大?

       采取的策略:对前r-1个人都拒绝,然后对剩下的n-r+1个人进行面试,如果任何一个面试者比之前面试的人都优秀,那么就聘请这个人。前r-1个人被聘请的概率为0,假设从第r个人开始面试,面试到的第k个人是最优秀的并且被选中的应聘者。那么

最优秀应聘者被选择的概率为:

 

其中,第k个为最优秀的并且被选中的人,根据概率论的知识,可以化简为,第k个人在最优秀的前提下被选择。因为最优秀的人只有一个,所以它的概率为1/n,同时也就意味着,在前k-1中,最优秀到人在r-1个人中。

       既然是最优秀的,那么,最优秀应聘者被选择的概率大于他前后应聘者被选中的概率,所以有,

得到r一般表达式,现在要找到最优解,等价于找到满足下列条件最小的r值:

The university of Alabama in Huntsville对上述表达式部分n值求解结果如下:

 

观察可知结果在逐渐变小,Alabama大学对表达式中不同n值与P的关系作图,详见链接:   http://www.math.uah.edu/stat/urn/Secretary.html        这里通过表达式一样可以近似得出与Alabama大学描述相同的结果,解答过程如下:

      当n趋于无穷大,调和数列求和可以近似化简,

 

 

所以,经典秘书问题得出面试中应聘到最优面试者的概率是0.368,通俗所,100个人来面试,第36个人或者第37个人是最优应聘者的概率是最大的。 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
最优控制理论是一种数学工具,通过寻找最优控制策略,能够使系统达到最佳性能。其应用广泛,涵盖了许多领域。 首先,在工程领域中,最优控制理论可以应用于机械、电气、航空等各种系统,以提高系统性能。例如,在航空领域,最优控制理论可用于设计飞机的自动驾驶系统,使飞机具有更高的飞行效率和安全性。 其次,在经济领域,最优控制理论可以用于优化资源分配和经济决策。例如,在生产计划中,最优控制理论可以优化产品的生产线,以最大化产量和利润。在金融投资中,最优控制理论可以应用于股票的买卖决策,以获取最大的回报。 此外,在环境保护领域,最优控制理论可以应用于优化环境资源的利用和污染控制。例如,在能源管理中,最优控制理论可以用于设计能源系统,以最大程度减少能源浪费和减少对环境的影响。 最优控制理论也在交通运输领域有着广泛的应用。例如,在交通信号灯控制中,最优控制理论可以应用于优化信号灯的时序,以减少拥堵和提高交通效率。在自动驾驶汽车中,最优控制理论可以应用于优化车辆行驶轨迹,以实现安全和高效的行驶。 总之,最优控制理论具有广泛的应用前景,在不同领域都可以发挥重要作用,提高系统的性能和效率,并为我们解决实际问题提供有效的方案。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值