最优停止理论OptimalStoppingTheory经典秘书问题ClassicSecretaryProblem

本文介绍了最优停止理论中的经典秘书问题,探讨如何在有限的面试者中以最大概率选择到最优秀的人选。通过策略分析,指出在面试前36%的人后选择下一个最优秀者的方法能最大化选到最佳秘书的概率。当面试人数趋向无穷大时,这一概率接近0.368。
摘要由CSDN通过智能技术生成

在博弈论中,类似问题,有相亲问题、见好就收、苏丹嫁妆问题、挑剔的求婚者问题等 。首先通俗解下类似问题:相亲问题,售房问题。

       相亲问题描述如下:

       假如一个非常优秀的人相亲,已知追求的他的人有有限个,例如10位,并且根据个人的评价,给这10个人给予了综合打分。现在规定,交往中他不能脚踏两只船,即不能同时和两个人交往,如果在交往之后他没有接受这个人,那么,以后也没有机会再选择这个人作为对象。然后接着和下一个人交往。

       这个问题可以看出,无论什么时候选择都会面临很多不确定性,比如无法预知是否错过了最优秀的人选,或者在选择后,后面会不会有更好的人选。那么,他随机和这些人交往,在和第几个人交往时,他能选择到最优秀的人作为对象呢,即何时停止交往可以使他选择到最优秀的人最为对象呢?

下面是停止规则的一般归纳,它是通过两个对象来定义的:

      (1)一系列随机变量X1,X2,…,它们的联合分布规律是已知的,

      (2)一系列奖励函数Y0,Y(X1),Y(X1,X2),…

       在考虑这两个对象时,你可以一直观察随机变量X1,X2… 在观察变量Xn时,你可能会选择停止,这个时候你获得的奖励是函数Yn(X1,X2,X3…,Xn),当然这个函数值也可能是负数,比如女青年相求问题,加入相亲了N个人(N很大),那么她会经历从“剩斗士”到“必剩客”再到“齐天大剩”的过程,想想,还是很吃亏的(不仅木有回报࿰

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值