朴素贝叶斯分类器是一系列以假设特征之间强(朴素)独立下运用贝叶斯定理为基础的简单概率分类器。下面我们通过西瓜判定的实例,阐述利用贝叶斯算法进行简单模式识别分类的过程。
鉴于概率论与数理统计基础,我们直接引入贝叶斯公式:
P(B|A)=P(B)P(A|B)/P(A)
现在来假设场景,炎炎夏日购买西瓜解暑,市场上的西瓜从品相来看各有优点,通过西瓜特征来进行判别西瓜好坏,我们首先进行数据采集和特征分类,统计数据如下:
下面举例说明条件风险公式:
假设样本有五类,把样本j划分为2类时的条件风险如何计算?
通过公式带入,得到式子:公式中h(x)意为判定准则,因为能力难题也没有搜集到较好的资料论述,此概念略过不提。
日常生活中,人们倾向于将风险最小化,那么由此产生最小化总体风险的概念: