朴素贝叶斯算法的的目的:寻求一个分类器f(n),使得对任意的Xi,通过分类器能找到唯一的Yi。
特征I有{X1,X2,X3…Xn}
类别C有{Y1,Y2,Y3…Yn}
朴素贝叶斯的核心算法:
可以表述成如下形式:
例子:
如果直接在数据中找,不帅/性格不好/身高矮/不上进,最终嫁人的概率,可能为零。通过分别求解,嫁但不帅,嫁性格不好。。。的概率,可以将问题简化处理。
朴素贝叶斯算法的基础是,各个特征之间的独立性。
问题:为什么朴素贝叶斯这么朴素?
答:朴素贝叶斯假设各个特征之间相互独立,彼此不受影响。
朴素贝叶斯理解:
朴素贝叶斯是求解在得到一定条件下,产生某种结果概率的算法(在知道一个人”不帅/上进“情况下,求嫁给此人的概率);
这个问题可以转化为,在已知的样本中,P(”不帅 上进“,”嫁“)/P(”不帅 上进“)=P(”不帅 上进“|"嫁”)P(“嫁”)/P(”不帅 上进“)。