首先是“朴素”一词,代表的是假设各特征之间相互独立,互不影响,虽然如此,其实际表现也较为不错。
其原理大致如下:
假设一个二分类问题,评价一个女生漂亮与否,主要有如下指标:长发与否,身高高矮,体型胖瘦,给出一个合适的数据集
现在有这样一个女生,高,长发,瘦,判断这个女孩是否漂亮,即求
P(漂亮|高,长发,瘦) = (P(高,长发,瘦|漂亮) * P(漂亮)) / P(高,长发,瘦)
P(不漂亮|高,长发,瘦) = (P(高,长发,瘦|漂亮) * P(不漂亮)) / P(高,长发,瘦)
较大概率者即为其分类,其分母都是相同的,所以只需要比较分析大小。
由于已经假设各特征相互独立、各不影响,故分子可简化为如下形式:
P(漂亮) * P(高|漂亮) * P(长发|漂亮) * P(瘦|漂亮)
argmax一下即得到结果
判别结果就不用我多说了吧!
还有一点就是会产生概率为0的点 ,为了避免出现这种情况,使用贝叶斯估计,通常参数为1,即拉普拉斯平滑什么什么的,这地方还没理解,后边再补