1.朴素贝叶斯
1.1背景
朴素贝叶斯来源于贝叶斯学派,他们的理论与传统的统计学观点相悖,其中最大的分歧点之一是关于“先验”的使用。传统统计学认为概率即频率,计算概率只应从观测到的数据出发,是客观的。但是贝叶斯学派则认为处理现实中的问题可以加入主观的考虑,即先验。在我看来他们的分歧十分有趣,分歧点似乎甚至可以上升到哲学,即唯物与唯心的不同上,如果一个人是坚定的唯物主义者(非辩证),那么我想他应该不会支持贝叶斯的理论。(瞎想的,如果有问题请指正)
贝叶斯理论发展至今已经十分完善,它可以用来解决很多机器学习以及人工智能的问题。它在该领域最主要的工作是进行分类。
1.2理论内容
朴素贝叶斯是贝叶斯分类法的一个简单分支,将其称为朴素(Naive)是因为它对分类问题有一个很严格的假设,使问题简化从而得到解决。这套说辞好熟悉,原来我们在面对线性回归与广义线性模型的时候也说过,所以这么一想我觉得线性回归是不是可以叫 Naive Linear Regression呢。
朴素贝叶斯的假设是:x的各个特征信息具备条件独立性,即它们彼此相互独立,互不影响。
公式:
其中p(y)就是先验。分类任务中,我们有很多标签值/类别(y1,y2,y3...),在算一组数据已知(x1,x2,x3...)的情况下结果为