· 参考了libsvm官方guide
· 建议流程:
许多初学者使用如下的步骤:
· 将数据转换成SVM程序包的格式
· 随机的尝试一些核函数和参数
· 测试
而我们建议初学者先尝试如下的步骤:
· 将数据转换成SVM格式包的格式
· 对数据进行简单的缩放处理(scaling)
· 考虑RBF核:LibSVM分类的实用指南
· 使用交叉验证(cross-validation)寻找最佳参数C和Υ
· 使用最佳参数C和Υ来训练整个训练集
· 测试
所以实验的时候采用的步骤是:
1)按照LIBSVM软件包所要求的格式准备数据集;
2)对数据进行缩放;
3)考虑选用RBF 核函数;
4)采用交叉验证选择最佳参数C与g ;
5)采用最佳参数C与g 对整个训练集进行训练获取支持向量机模型;
6)利用获取的模型进行测试与预测
1)LIBSVM软件包所要求的格式如下:
[label] [index1]:[value1] [index2]:[value2] ...
[label] [index1]:[value1] [index2]:[value2] ...
label对应样本标签就是样本的类别,index可以理解为第几个特征,value就是对应特征的特征值
2)对数据进行缩放
由于数据可能存在过大或过小的问题,所以将数据缩放到合理的范围之内进行训练和分类,但要注意的是,训练和分类进行缩