Opencv2.4.9源码分析——Normal Bayes Classifier

最新推荐文章于 2022-09-02 17:59:47 发布

zhaocj

最新推荐文章于 2022-09-02 17:59:47 发布

阅读量5.3k

点赞数

分类专栏： opencv

本文链接：https://blog.csdn.net/zhaocj/article/details/50615049

版权

本文详细介绍了OpenCV中的正态贝叶斯分类器，区别于朴素贝叶斯，正态贝叶斯不需要特征间独立的假设，适用范围更广。文章首先讲解了朴素贝叶斯分类器的原理，包括概率模型、极大似然估计、平滑处理等，然后重点阐述了正态贝叶斯分类器的工作机制，涉及均值向量、协方差矩阵的计算。最后，通过实例展示了如何使用OpenCV实现正态贝叶斯分类器进行性别预测。

摘要由CSDN通过智能技术生成

一、原理

OpenCV实现的贝叶斯分类器不是我们所熟悉的朴素贝叶斯分类器（Naïve Bayes Classifier），而是正态贝叶斯分类器（Normal Bayes Classifier），两者虽然英文名称很相似，但它们是不同的贝叶斯分类器。前者在使用上有一个限制条件，那就是变量的特征之间要相互独立，而后者没有这个苛刻的条件，因此它的适用范围更广。为了保持理论的系统性和完整性，我们还是先介绍朴素贝叶斯分类器，然后再介绍正态贝叶斯分类器。

1、朴素贝叶斯分类器

朴素贝叶斯分类器是一种基于贝叶斯理论的简单的概率分类器，而朴素的含义是指输入变量的特征属性之间具有很强的独立性。尽管这种朴素的设计和假设过于简单，但朴素贝叶斯分类器在许多复杂的实际情况下具有很好的表现，并且在综合性能上，该分类器要优于提升树（boosted trees）和随机森林（random forests）。

在许多实际应用中，对于朴素贝叶斯模型的参数估计往往使用的是极大似然法，因此我们可以这么认为，在不接受贝叶斯概率或不使用任何贝叶斯方法的前提下，我们仍然可以应用朴素贝叶斯模型对事物进行分类。

朴素贝叶斯分类器特别适用于输入变量的维数很高的情况，并且它只需要极少量的训练数据就可以估计出分类所需的参数。

抽象地说，朴素贝叶斯是一种条件概率模型：我们要对一个个体进行分类，该个体用代表n个特征（相互独立的变量）的n维向量表示，即x = (x₁,…,x_n)^T，则分配给该个体的概率为：

（1）

该式表示K个可能输出或分类中第k个分类的概率，C_k表示第k个响应输出，即分类结果。

如果个体的特征数量n很大，或者某个特征有大量的数值，则应用式1对个体进行分类是不可行。因此我们应用贝叶斯理论，把条件概率进行分解，使其更利于操作：

（2）

基于认识论的解释，概率是一种置信程度的度量。贝叶斯理论把某个事件在考虑证据之前和之后的置信程度关联了起来。回到式2，p(C_k)表示在不考虑个体x的情况下，第k个分类的概率，我们把它定义为先验概率，而p(C_k|x)表示在考虑个体x的情况下，第k个分类的概率，我们把它定义为后验概率，p(x| C_k)定义为似然度，p(x)定义为标准化常量。