作者:Jason Brownlee
翻译:陈超
校对:欧阳锦
本文约3500字,建议阅读8分钟
本文共分为5部分,从概率模型的挑战、概率模型——贝叶斯信念网络、如何建立和使用贝叶斯网络、贝叶斯网络范例、Python当中的贝叶斯网络5个方面对贝叶斯信念网络进行了简要介绍。
关键字:贝叶斯,Python,概率模型
概率模型可以定义变量间的关系并用于概率计算。
例如,全条件模型可能需要一个巨大的数据量来覆盖所有可能的实例,而在实际情况当中概率可能难以计算。虽然像所有随机变量条件独立这样简化假设是过于简化的步骤,但比如在朴素贝叶斯的例子当中可能是非常高效的做法。
另外一种选择是建立一个保留已知的随机变量和所有其他例子当中的条件独立性模型。贝叶斯网络是一个概率图模型,可以明显地在一个图模型中用有向边捕获已知的条件依赖。所有丢失的连接定义了模型中的条件独立性。
这样的贝叶斯网络提供了一个有用的工具,可以将某一领域的概率模型进行可视化,回顾所有随机变量之间的关系,在给定可用证据的情况下因果概率的原因。
在这篇文章当中,你将会得到针对贝叶斯网络的简要介绍。
在读完本文之后,你将会知道:
贝叶斯网络是一种概率图模型,由节点和有向边构成。
贝叶斯网络模型捕获随机变量之间的条件依赖和条件独立关系。
模型可以由专家构造或基于数据学习,然后可以用于估计因果或后续事件的推断。
可以基于我的新书《机器学习概率》开始你的项目,这里包括了手把手的教程以及所有范例的Python源代码。
让我们开始吧!
贝叶斯信念网络简介 图片来自Armin S Kowslski,部分版权保留
概览
本教程分为以下五部分;他们是:
1. 概率模型的挑战
2. 概率模型——贝叶斯信念网络
3. 如何建立和使用贝叶斯网络
4. 贝叶斯网络范例
5. Python当中的贝叶斯网络
概率模型的挑战
概率模型的设计和使用是相当有挑战性的。
通常情况下,问题在于缺乏关于完全确定随机变量的条件依赖性的信息。如果这种信息不足的情况确实存在, 那么计算某一时间的全条件概率可能是不切实际的。
解决这一挑战的通用方法是添加一些简化的假设,例如假设模型当中所有的随机变量都是条件独立的。这是一个强假设,虽然它在实际过程中被证明十分有用,为朴素贝叶斯分类算法提供了基础。