1.贝叶斯分类:
优点:对于数据型和非数据型特征都适用;对超参数的要求低;有数学基础作为支撑;
缺点:认为特征之间相互独立,这往往不一定成立;需要知道先验概率
2.决策树:
优点:对于数据型和非数据型特征都适用;高维数据也可用;简单且易于理解;
缺点:对取值多的特征有偏向性;容易过拟合;忽略了特征之间的关系;不适用于高维稀疏数据
3.SVM:
优点:线性可分和非线性分类都能搞定;能够高维分类;泛化能力强;
缺点:计算复杂度高;对噪声和缺失数据敏感;需要选择合适的核函数
4.KNN:
优点:思想简单,理论成熟,既可以分类又可以回归;非线性分类也可以;可多分类;
缺点:计算复杂度高;内存消耗大;k的选择需要研究
5.逻辑回归:
优点:简单有效;主要针对二分类,可以推广到多分类(一对一,一对多);对线性关系有比较好的拟合;
缺点:对特征工程的要求比较高