可见分成了四大类:回归,分类,聚类,降维
监督学习首选SVM(不论分类还是回归,分类用SVC,回归用SVR)
在回归中:
SVM不好用就换核函数
在分类中:
SVM不好用按照特点继续选择
对于文本分类问题用NB,对于样本依赖性强问题用KNN
在实际解决问题的时候要注意以下几个方面:
『对数据的认识太重要了!』
『数据中的特殊点/离群点的分析和处理太重要了!』
『特征工程(feature engineering)太重要了!』
『模型融合(model ensemble)太重要了!』
引用看过的一篇博客对于一个实际的项目解决方法: