1、朴素贝叶斯:生成式模型
优点:
发源于古典数学理论,有坚实的数学基础,以及稳定的分类效率
速度较快,对特征概率的运算
对小规模数据表现很好,能处理多分类任务
对缺失值不敏感,算法简单,常用于文本分类
对结果解释容易理解
缺点:
需要计算先验概率
对输入数据的表达形式很敏感
由于使用了样本属性相互独立的假设,故如果样本属性有关联时效果不好
应用:
文本分类;人脸识别
2、逻辑回归:判别式模型
优点:
实现简单,广泛的应用于工业问题上
计算量非常小,速度快,存储资源低
便利的观测样本概率分数
多重线性并不是问题,可结合L2正则化来解决问题
易于理解和实现
缺点:
容易欠拟合,一般准确度不高