请点击上面公众号,免费订阅。
主要推送关于对算法的思考以及应用的消息。培养思维能力,注重过程,挖掘背后的原理,刨根问底。本着严谨和准确的态度,目标是撰写实用和启发性的文章,欢迎您的关注。
01
—
回顾
最近,阐述了朴素贝叶斯的2个例子引出了朴素贝叶斯的分类原理,给出了苹果的三个特征通过朴素贝叶斯分类器预测了第11个苹果是好果Or不好果,预测时发现某个分类中某个属性值恰好在数据集中没有出现,此时直接会抹去其他属性值,这个是不合理的,因此又论述了如何用拉普拉斯修正来解决这个问题,具体参考:
昨天,建立在以上对朴素贝叶斯分类器理解和消化的基础上,在Jupyter Notebook中亲自实践和实现了《自动单词拼写纠正器》,里面带有详细的原理说明和实现 python源码,有需要的可以@我,这个还是非常有趣的,最近距离的体会机器学习带给我们的快乐和兴趣,欢迎阅读和交流:
机器学习:单词拼写纠正器python实现
02
—
放松:属性独立假设
朴素贝叶斯分类器的一个重要假定:分类对应的各个属性间是相互独立的,然而在现实应用中,这个往往难以做到,那怎么办呢?
很简单,适当考虑一部分属性间的相互依赖关系,这种放松后的分类称为半朴素贝叶斯分类,其中最常用的策略:假定每个属性仅依赖于其他最多一个属性,称其依赖的这个属性为其超父属性,这种关系称为:独依赖估计(ODE)。
因此,对某个样本x 的预测朴素贝叶斯公式就由如下:
修正为如下的半朴素贝叶斯分类器公式:
从上式中,可以看到类条件概率 P(xi | c) 修改为了 xi 依赖于分类c 和 一个依赖属性pai 。
03
—
半朴素贝叶斯例子解释