新华书店的一道数学题

    今天去新华书店,去翻查一本在意了很久的书,第一次深刻的认识到在新华书店确切的找一本书是多么的困难。

    首先在书店电脑上查这本书,获得这本书的详细信息,包括分类,作者,出版社,编号。这里我们假设分类是经济,新华书店的经济分类十分诡异,囊括了经济学原理,市场营销,企业管理,通俗读本(股票,金融,房地产),口才,心理学,每一各分类大概有5-8个书架,每个书架400本书左右。单从整个问题解域来看,找到这本书的概率0.01%一下。那么要做的就是缩小解空间,假设解域为S(A1,A2,A3,A4,A5..An..),A为分类的子解域。

     在新华书店中,首先无法通过电脑准确定位一本书的位置,其中书目的详细信息中,能够使用的信息只有分类和出版社信息。我要找的书名《影响力2》,中国人民大学出版社。这里问题就来了,我只知道书名,并不知道这本书属于什么分类。确切的说,放在很多分类下边我都觉得不为过,问题x∈Ai||x∈Aj...||x∈An为真(||为程序符号“并”,这里不讨论书店的查找策略有多么的龌龊,并假设我找不到这本书,则工作人员也找不到这本书),求解在最短的时间内我成功找到这本书的概率P(x)

      为了简化问题,这里我可以认为找到了正确的分类,就相当于找到了这本书,问题简化为

 使概率P( x的实际分类| 预期分类 )最大,即P( Ax| Ak )的最大概率, 1≤k ≤n

根据贝叶斯条件概率公式

P( Ax|Ak )= P( Ak|Ax )*P( Ax )/P(Ak)

P(Ak)为不变量,则有

P( Ax|Ak ) ∝ P( Ak|Ax )*P( Ax )

P( Ak|Ax )为相似度,P( Ax )为先验概率

这里的先验概率亦为不变量,P( Ax ) = 库存/总书目

取决于P( Ak|Ax ),这个相似度可以采用朴素概率法来计算(这个名称有待商榷),在书店查询系统中,查找带有影响力关键字的书目,在样本中统计所有出现分类的概率,即可获得P( Ak|Ax )

我们可以看到先验概率P(Ax)已经为0.01%一下,P( Ax|Ak ) < 0.01%

根据小概率事件原则,即便是排除所有的人为因素,我们可以认为在新华书店中找到一本只知道名称的书是不可能的事情。

 求证完毕。

参考资料:

数学之美番外篇:平凡而又神奇的贝叶斯方法

http://mindhacks.cn/2008/09/21/the-magical-bayesian-method/

数学之美 系列三 -- 隐含马尔可夫模型在语言处理中的应用

http://www.google.com.hk/ggblog/googlechinablog/2006/04/blog-post_1583.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值