条件独立假设:用于分类的特征在类确定的条件下都是条件独立的。 优点: 对待预测样本进行预测,过程简单速度快(想想邮件分类的问题,预测就是分词后进行概率乘积,在log域直接做加法更快)对于多分类问题也同样很有效,复杂度也不会有大程度上升在分布独立这个假设成立的情况下,贝叶斯分类器效果奇好对小规模的数据表现很好对缺失数据不太敏感,算法也比较简单 缺点: 朴素贝叶斯有分布独立的假设前提,而现实生活中这些predictor很难是完全独立的需要知道先验概率 机器学习面试题之朴素贝叶斯(九)