源自吴恩达的机器学习课程:
n是数据中特征的数量 m是样本数
1、如果n相对于m来说很大,或者跟样本数量差不多,则使用LR算法或者不带核函数的SVM(线性核函数)
n远大于m,n=10000,m=10-1000
2、如果n很小,m的数量适中(n=1-1000,m=10-10000)
使用带有核函数的SVM算法。一般使用高斯核
3、如果n很小,m很大(n=1-1000,m=50000+)
手动增加更多的feature然后使用LR算法或者不带核函数的SVM(变成第一种情况)。
注:LR和不带核函数的SVM比较类似。