为黑客设计的概率规划与贝叶斯方法

36大数据专稿,本文由36大数据翻译组Teradata大数据资深顾问黄民安 翻译,转载必须获得本站及译者的同意,拒绝任何不表明译者及来源的转载!

这是一本介绍贝叶斯方法和概率规划的书,该书首先从计算编程的角度,其次才是从数学的角度去分析概率规划与贝叶斯方法。该书的主要章节如下:

1. 序章

2. 内容

3. 案例

4. 阅读和安装说明

5. 开发

1. 序章

贝叶斯方法是自然推断的方法,但它的数理分析过程却很缓慢。本书贝叶斯推理的相关内容涉及两至三个概率论的章节,然后才介绍什么是贝叶斯推理。然而,由于大部分的贝叶斯模型难以理解,我们给读者展示的只是简单的例子。这可以让读者很快从案例理解什么是贝叶斯推理。

由于最近在一些机器学习竞赛中成功采用了贝叶斯算法,我决定再次对该算法进行深入调查。这本书试图弥补传统教材中贝叶斯数学与概率规划的脱节。

如果贝叶斯推理是目标,那么数学分析是实现这一目标的路径。另一方面,现在计算机运算能力的输出成本已经降低,我们可采取通过概率编程的方法。这样的方法更为可行,因为它降低了数学分析在每个运算步骤的干预,也就是去掉难以理解的数学分析过程,而采用贝叶斯推理。简单地说,这是一种计算路径,运算的中间过程相当于一个黑匣子。但是,编程者如果没有较强的数学背景,也很难使用这样的编程方法。

该书试图用通俗易懂的语言介绍贝叶斯推理。当然,这也是一本入门书。对于确实数学背景,却对贝叶斯推理感兴趣的读者,阅读该书已经足够了。

2. 内容

序章:我们为什么写这本书?

第1章:贝叶斯方法的理念与贝叶斯方法的实践,“什么是概率性问题?”

第2章:探索通过建模的实例来使用Python的PyMC,我们如何创建贝叶斯模型?

第3章:打开MCMC的黑匣子,讨论如何使用MCMC、马尔可夫链的分析工具。

第4章:最伟大的、非常实用的定理-大数定律。

第5章:如何抉择“失去一只手臂或一条腿?”我们引入使用损失函数和贝叶斯方法来解决这样的问题。

第6章:列出贝叶斯方法运用的优先事项。

章X1:在机器学习和构建模型验证贝叶斯方法中,我们探讨如何解决过度拟合问题。

章X2:更多PyMC相关的细节。

3. 案例

下面是黑客经常使用的贝叶斯方法。

案例1:推断用户行为,并更改用户的SMS消息

第1章中的案例。如果只是通过检查用户每日SMS消息中的噪声流,是难以检测的用户SMS行为的突然变化。在我们的第一个概率编程示例中,我们通过建立一个简单的模型,就能监控用户的行为变化,并预测用户将来可能发生的行为。

案例2:简单的AB测试

第2章中的案例。AB的测试,在其他文献中也被称为随机试验,是用于确定竞争方案之间的差别,以应用到网络设计、药物治疗、广告等领域。随着算法的改进,AB测试将以更直观的方法表现出来。

案例3:发现作弊行为

第2章中的案例。这是一个非常简单的算法,可以用来推断作弊的比例,同时还保守客户的隐私。

案例4:挑战者号航天飞机灾难分析

第2章中的案例。1986年1月28日,美国航天飞机计划的航天飞机挑战者的火箭推进器升空后不久爆炸,7名机组人员遇难。针对事故的总统委员会得出结论,认为它是由一个O形圈在火箭助推器中所引起的故障,而这种故障是由于O形圈存在设计缺陷,包括外界温度的影响。我们通过贝叶斯算法研究此数据,得出结论O型圈是灾难可能的原因。

案例5:贝叶斯方法的后验与MCMC:

第3章中的案例。后范式的可视化,使我们更加清晰的理解MCMC算法。例如,在下面图片中我们展示了两个不同的先验是如何可导致两个不同的后验。

案例6:数据的聚类

第3章中的案例。给定的一个数据集,有时我们要问,这些数据可能不是一种数据的来源。我们通过一个简单的数据聚类模型,就可以将数据分为两个集群。

案例7:数据优先程度的排序

第4章中的案例。考虑在线产品评级:我们的平均信用等级是多少。我们也明白,这样的一些评论,平均评级是不是真正价值的很好体现。这就带来一个问题,即我们如何对项目进行排序。

案例8:如何最优定价

第5章中的案例。在这里我们将告诉你如何进行优化定价。构建不确定性的贝叶斯模型,并通过损失函数推理,可以得出最佳路径。

案例9:Kaggle监测黑暗世界的解决方案

第5章中的案例。通过科学网站Kaggle,实时监测黑暗世界的大赛。

案例10:贝叶斯土匪

第6章中的案例。假设你面对有N个老虎机(在美国称为多武装土匪)。每个强盗有派发奖品的一个未知概率。当然,你不知道这些概率。面对多个老虎机,我们的任务是制定一项战略,通过贝叶斯土匪算法,以最大限度地提高我们的奖金。

4. 阅读和安装说明

这本书可以读出三种不同的方式,从最值得推荐方法排序如下:

第一、最值得推荐的选择是克隆该书的.ipynb文件下载到本地计算机。如果您已经安装了IPython,您可以打开浏览器,添加编辑章节,并运行提供的代码。

第二,打开nbviewer.ipython.org网站,在浏览器上显示IPython的笔记本电脑,将书籍内容同步到本地。

第三,我们也提供PDF版本! PDF文件是最小容量的,有静态和非交互式两种。

5、开发

这本书提供一个不同寻常的开发工具,而且内容是开源的,这意味着任何读者都可以成为编辑。

我们要感谢Python社区每一个参与者。同样,该书应用采用了PyMC数据库,非常感谢PyMC的核心开发者:克里斯Fonnesbeck,阿南德帕蒂尔,大卫·华德和约翰Salvatier。

另外本书是由IPython提供的开发工具,我们感谢IPython提供了的笔记本电脑接口。所有IPython的笔记本,可以通过GitHub的资源库,下载本书相应的文档。

主要作者:康.戴维森.皮隆 cam.davidson.pilon@gmail.com或 @cmrn_dp

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值