- 朴素贝叶斯之所加上“朴素”,主要是因为其在条件概率中假设为各个参数之间相互独立,比如P(X=x|Y=y),在其中假设X参数之间相互独立,就可以以乘积的形式求条件概率,否则,要求出相应的条件概率,几乎不可能,因为随着X参数以及Y类别参数的增加,需要求的参数是指数级别的增加,对计算量要求太高。
- 朴素贝叶斯经过期望风险最小化原则,可以只考虑P(Y=y)P(X=x| P=y),最后在Y类别参数中进行argmax就可以求出相应Y的概率,也即可以对类别进行预测。
- 朴素贝叶斯算法在连续变量中的应用,可以把P(Y=y)和P(X=x| P=y)用概率密度公式表示,其他的步骤和离散变量的朴素贝叶斯算法类似。
参考文献:
[1] 李航,统计学习 [M], 2019,北京:清华大学出版社.