要理解朴素贝叶斯,我们首先需要了解贝叶斯推断。贝叶斯推断是一种用贝叶斯定理来迭代假设概率的方法。贝叶斯定理是在掌握与相关事件的先决信息下,计算该事件的概率。
假设你想计算星期天下午5点得到一个停车位的概率。那么你如何计算这一事件的概率呢?是的,贝叶斯定理!
数学上贝叶斯定理写为:
这里"B"是一个条件,"A"是一个事件。在上面的例子"B"可以是"星期日"或"下午5点",因为这是影响结果“A”的两个条件:您是否会得到停车位。但是,如果您想要同时考虑这两个条件,那又会怎么样呢?这就是贝叶斯定理出现问题的地方。为了在同时考虑这两个条件时利用贝叶斯定理,我们必须做出一个假设。
假设:我所有的条件都应该是"有条件的而且独立的"。
我特别提到有条件的独立而不是相互独立一词, 因为有区别。条件独立性意味着结果值(无论您是否获得停车位)应解释条件之间的所有依赖性。例如:周日获得停车位,下午5点获得停车位并不是相互独立的。一个情况可能导致其他情况。如果是星期天, 下午5点停车的机会可能会减少。但是,如果我检查条件独立性, 两个功能依赖性是由结果属性, 即获得一个停车位解释。