贝叶斯推理:基本概念
最近在读这本书,《Bayesian Methods for Hackers : Probabilistic Programming and Bayesian Inference》,即《贝叶斯方法的高级用法:概率编程和贝叶斯推理》,作者是 Cameron Davidson-Pilon。
概率统计是机器学习、深度学习等人工智能技术的基础理论之一;贝叶斯推理是概率统计实用价值最大的组成部分之一。
本书用代码和图表实例化、形象化地阐释贝叶斯推理,避开了数学公式的生硬呆板、繁难枯燥的说教,使得人们能看懂代码和图表就能理解贝叶斯推理的具体方法。
感觉书写得不错,能读懂、受启发、有收获,所以把一些心得体会记下来、说出去,但愿对别人也有用。
先把本书阐述贝叶斯推理的基本观点罗列如下:
1. 贝叶斯方法是数据专家(data scientist)使用的诸多工具之一。它可用于预测、分类、分级、推理、识别垃圾邮件,等等。
2. 贝叶斯学派认为概率是对某一事件的发生相信的程度,是对这一信念强弱的度量。
3. 为了兼容传统概率论,贝叶斯学派把对事件 A A 的信念记作
,并称作先验概率。
4. 新的证据 X X 出现后,对事件
的信念记作 P(A|X) P ( A | X ) ,并称作后验概率。
5. 贝叶斯推理的结果有2个值:事件 A A 为真和假两个概率(例如,分别为0.8与0.2)。传统概率学派的频率方法只有事件
为真的一个值。
6. 在证据较少时,贝叶斯推理优于依赖大数据集的频率方法。
贝叶斯定理是这般模样: