理论
1、算法优缺点:
(1)优点:在数据较少的情况下,依然有效,可以处理多分类问题;
(2)缺点:对输入数据的准备方式较为敏感。
(3)适用于标称型数据
2、条件假设:
(1)假设变量间相互独立,即 p(x|ci)=p(x1|ci)∗p(x2|ci)∗···∗p(xn|ci) ; ( xi 可以看做特征)
(2)假设所有变量同等重要。
3、基本原理:
贝叶斯准则:
p(c|x)=p(x|c)p(c)p(x)
根据变量相互独立性,对于给定数据 x ,求结果为
p(ci|x)=p(x1