LIBSVM学习(七)--参数解释

本文详细介绍了LIBSVM库中的三个主要工具:svmscale、svm-train和svm-predict的用法。svmscale用于数据缩放,避免数值计算困难并提高训练速度和准确率。svm-train涉及各种参数设置,包括核函数类型、惩罚系数C和核函数参数等。svm-predict则用于模型预测。通过实例展示了每个工具的命令行用法。
摘要由CSDN通过智能技术生成

最近学习libsvm库,将一些个人认为可以mark的东西做了记录,虽然README文档很清晰,但是在这篇文章中列出了dual problemd和核函数的公式,这样在选择参数时更加清楚。刚开始学习LIBSVM库时直接一脸懵,现在也还是在不断摸索中,如若有理解错误,请指出哦,谢谢!

Libsvm 使用步骤:
1. 按照libsvm要求的数据格式,将要训练和预测的数据准备好;http://blog.csdn.net/u014772862/article/details/51828981
2. 使用svm-scale实现数据缩放,可有可没有,需要按照特征的相关性进行操作;
3. 考虑svm-train时是否使用核函数以及核函数的选择,建议首先考虑RBF核函数;
4. 采用grid.py选择最优参数c和g;http://blog.csdn.net/u014772862/article/details/51829727
5. 设置svm-train参数,对整个数据集训练获取svm模型;
6. 利用svm-predict加载训练好的模型进行测试与预测。

1. svmscale 的用法

对数据集缩放的目的在于:
1)避免原始数据中部分特征范围过大而另一部分特征范围过小;
2)避免在训练时选择核函数计算内积时引起数值计算的困难;
3)加快训练速度,提高准确率。
因此,将数据缩放到[-1,1]或者[0,1]之间。

用法:svm-scale [options] data_filename”
其中,options选择如下:
-l lower,数据下限标记,设置lower值表示缩放后数据下限,默认为-1;
-u upper,数据上限标记,设置upper值表示缩放后数据上限,默认为1;
-y y_lower y_upper,是否对目标值同时进行缩放,y_lower 表示下限值, y_upper表示上限值;
-s save_filename,将缩放的规则保存为文件save_filename;
-r restore_filename,表示将缩放规则文件restore_filename载入后按此缩放;
fi

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值