![3b52e11570388f036f37ca3e1c143648.png](https://i-blog.csdnimg.cn/blog_migrate/291f000eb1a78bd280cff90f5fbc08dd.jpeg)
首先必须要声明一下,我不是专业做贝叶斯的,写这篇文章主要是科普,其中涉及到的数学公式我会用更加浅显易懂的方式来描述,方便大家都能够有所收获。同时我认为贝叶斯并不是机器学习的专属,了解一下这个神级算法,打开一扇窗,相信你会有不同的看法。
源头
聊一个算法就要清楚它的历史,它怎么来的,最先用来解决什么实际问题,它根本原理以及推导过程是怎么样的,在现在有什么重要的应用,以及对于未来贝叶斯发展有什么看法等,这既是一套了解一个算法的流程,也是一种分析问题的思路。
先聊一聊贝叶斯算法是怎么来的,看一下维基百科上面的描述
所谓的贝叶斯方法源于贝叶斯生前为解决一个“逆概”问题写的一篇文章,而这篇文章是在他死后才由他的一位朋友发表出来的。在贝叶斯写这篇文章之前,人们已经能够计算“正向概率”,如“假设袋子里面有N个白球,M个黑球,你伸手进去摸一把,摸出黑球的概率是多大”。而一个自然而然的问题是反过来:“如果我们事先并不知道袋子里面黑白球的比例,而是闭着眼睛摸出一个(或好几个)球,观察这些取出来的球的颜色之后,那么我们可以就此对袋子里面的黑白球的比例作出什么样的推测”。这个问题,就是所谓的逆概问题。
这么说就比较抽象,我们用一个实际生活的例子来详解贝叶斯,顺便体会它的应用。
算命问题
首先需要普及两个概念,先验概率和后验概率,不明白?上例子。
村里面以前会有一些算命先生,测吉凶,但是作为算命先生来讲如何测的更加准确甚至是百发百中呢。算命先生通常会通过问一些问题来达到他对于你的了解。今天假设小布是算命先生,现在开始算命了,如果我对这个人没有任何了解,包括他的年龄、居住环境等等。按统计学的角度来说,一个人有三高(高血压、高血脂、高血糖)的概率咱们先认为是20%。那么,这个概率 P(三高