SVM优点:
- 用于二元和多元分类器、回归和新奇性检测
- 良好的预测生成器,提供了鲁棒的过拟合、噪声数据和异常点处理
- 成功处理了涉及到很多变量的场景
- 当变量比样本还多是依旧有效
- 快速,即使样本量大于1万
- 自动检测数据的非线性,不用做变量变换
SVM缺点:
- 应用在二元分类表现最好,其他预测问题表现不是太好
- 变量比样例多很多的时候,有效性降低,需要使用其他方案,例如SGD方案
- 只提供预测结果,如果想要获取预测概率,需要额外方法去获取
- 如果想要最优结果,需要调参。
使用SVM预测模型的通用步骤
- 选择使用的SVM类
- 用数据训练模型
- 检查验证误差并作为基准线
- 为SVM参数尝试不同的值
- 检查验证误差是否改进
- 再次使用最优参数的数据来训练模型
SVM种类,用途和关键参数表
主要分为三类:1、分类 2、回归 3、异常检测
TIPs:SVM模块包含2个库:libsvm和liblinear,拟合模型时,python和这两个库有数据流,会消耗一部分内存。
如果内存足够,最好能够把SVM的cashe_size参数设置大