LibSVM 工具箱...不可分肿么办！

最新推荐文章于 2024-01-25 10:29:51 发布

三少GG

最新推荐文章于 2024-01-25 10:29:51 发布

阅读量2.8k

点赞数

分类专栏： PKU Research 文章标签：工具 go vector classification python

PKU Research 专栏收录该内容

64 篇文章 1 订阅

订阅专栏

请教Matlab中svm libsvm工具箱分类问题

为什么在训练集上的准确率达到了100％
但是在测试集上的准确率只有46％
我也用交叉验证寻找了最优的c和g，依然在训练集的准确率恨高
但是在测试集不到50％显然是失败的分类
能不能说明我的数据根本就不能分类呢？

是哪些因素影响了测试集上的准确率？

如果规范化数据才是最好的呢？

+++++++=

一则看看数据有没有问题,若数据没有问题..

那就说明你需要进行数据的预处理[去噪,归一化,特征提取]

尤其是需要特征提取,或者你进行了特征提取,但特征提取的不好,无法表征测试数据的结构!!.

faruto老师说的不错
我怀疑是我的数据本身就没甚么特征。。也就是不可能找到个模型来分类

如何才能进行特征提取那？

+++++++++++++++++++++++++++++

特征提取涉及到的面就很广了.因为不同的数据有不同的特征提取的办法..

这需要看的东西就多了.无法.详细说.

这要的就是什么pca ica 谱特征什么乱起八糟的....还有一大堆呢....

++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
svm-light、libsvm 和 svmtorch（torch）

http://hi.baidu.com/superdxf/blog/item/b169cc1686d38a4f21a4e9ee.html
最近用了这两种software去测试打手机，发觉svmlight速度比较快，准确率还可以，而且便于操作，而libsvm在train的时候速度不够快，而且操作起来挺麻烦，更重要的是在c++中测试单个图片的时候非常慢，一张576*720的图片要费3秒左右的时间，几乎是svmlight的三倍！这个无论如何优化都不可能提高太大，虽然准确率还可以，但是毕竟速度太慢，用在trecvid上面根本不work，还是将注意力转移到svmlight上面来，用mask的方法去除一些区域，然后选择更好的正样本，加上PCA，再对每个块进行大小scale的调整，测试一下，看看结果如何再说吧！

http://blog.sina.com.cn/s/blog_4c98b96001000ald.html
今天做了七组实验，数据集采取的是UCI的数据集，a1a-a7a,SVMlight采用的是默认的参数设置，其实本来开始使用RBF的呢，效果很烂，后来改为poly的也不行，最后实在不行了，偶然的用线性的做了一次，结果效果最好，说明其实很多时候数据线性可分可能性还是很大的。当然因为数据都是向量的形式提供的，我们没有办法知道这些向量背后的意义是什么。LIBSVM用的也是线性的，为了对比的需要我们同样采用的是最简单的形式，是c-SVM的形式。没有采用启发式原则，这点让笨笨有点疑惑，因为从理论上来说如果采用启发式原则正确率会高一些，但是实际却相反。针对这两种算法比较了它们呢的traing time和predicte time和accuracy，可以看到libsvm和svmlight的accuracy是相当的，但是时间就差很多了，svmlight要比libsvm快了很多倍，而且在predict时除了IO操作之外，svmlight几乎没有使用cpu的时间，再一次证明了svmlight的强大优势。其实本来对HeroSVM抱有很大的希望，因为它比SVMlight还要快9-10左右，这个相当好了，但是不开源需要money，近期又不对外了，所以很是郁闷，精力再一次转换到了SVMlight身上了。

http://www.newsmth.net/bbsanc.php?path=/groups/sci.faq/AI/SourceCodes/M.1202657568.T0
我做过一些测试，二类问题SVMlight要比libsvm快很多。
svmlight是用c写的，结构化程度不高，读起来可能有点费力；libsvm要清晰一点；但是和svmtorch比起来感觉还是torch要好一些。

http://whalebox.blogspot.com/2008/03/libsvmsvm-light-zz.html
其中，libsvm似乎是从svm-light基础上发展起来的。但是在解二次规划的方法上，没有完全沿用svm-light的方法。我做了些简单的实验，发现普遍来说，svm-light比libsvm快，而且效果好一些。不知道有没有大侠对他们有研究，比较一些如何？ 不过，libsvm很容易使用，很容易被集成在自己的cpp工程中，svm-light似乎很麻烦吧，呵呵。

各种SVM程序的比较：
http://hi.baidu.com/oliveai/blog/item/50e6c5ceba62bb3fb600c8a1.html

+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++

补充:在WindowsXP+OpenCVRC1平台下整合OpenCV与libSVM

虽然从RC1版开始opencv开始增设ML类，提供对常见的分类器和回归算法的支持。但是尚存在一些问题，比如说例子少（官方许诺说很快会提供一批新例子,见CVS版）。单说SVM这种算法，它自己提供了一套比较完备的函数，但是并不见得优于老牌的libsvm（它也应该参考过libsvm，至于是否效率优于libsvm，我并没有作过测试，官方也没有什么说法，但是libsvm持续开源更新，是公认的现存的开源SVM库中最易上手，性能最好的库）。所以在你的程序里整合opencv和libSVM还是一种比较好的解决方案。在VC中整合有些小地方需要注意，这篇文档主要是提供把图象作为SVM输入时程序遇到的这些小问题的解决方案。希望大家遇到问题时，多去读libSVM的源码，它本身也是开源的，C代码写得也很优秀，数据结构定义得也比较好。

首先是SVM的训练，这部分我并没有整合到VC里，直接使用它提供的python程序，虽然网格搜索这种简易搜索也可以自己写，但是识别时只需要训练生成的SVMmodel文件即可，所以可以和主程序分离开。至于python在windows下的使用，还是要设置一下的，首先要在系统环境变量path里把python的路径设进去，libsvm画训练等高线图还需要gnuplot的支持，打开python源程序(grid.py)，把gnuplot_exe设置成你机器里的安装路径，这样才能正确的运行程序。然後就是改步长和搜索范围，官方建议是先用大步长搜索，搜到最优值後再用小步长在小范围内搜索（我觉得这有可能会陷入局部最优，不过近似出的结果还可以接受）。我用的python版本是2.4，gnuplot4.0。

常用libSVM资料链接

官方站点，有一些tutorial和测试数据

哈工大的机器学习论坛，非常好

上交的一个研究生还写过libsvm2.6版的代码中文注释，源链接找不着了，大家自己搜搜吧，写得很好，上海交通大学模式分析与机器智能实验室。

+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++

++++++++================================================================

libsvm FAQ!!!!!!

英文原版地址： http://www.csie.ntu.edu.tw/~cjlin/libsvm/faq.html#_TOP

中文翻译地址： http://blog.csdn.net/ssrs626/archive/2008/11/09/3261520.aspx

(或者 http://happybaby99.blog.sohu.com/76788562.html)

这几天写论文用到libsvm，下载了程序和源码，却不知道怎么用，在网上搜了一大箩筐，还是没什么进展。后来发现了几个不错的介绍。

转载 1.http://blog.csdn.net/lanseliuying/category/331083.aspx

转载2.FAQ http://www.csie.ntu.edu.tw/~cjlin/libsvm/faq.html#f203

问: 我在那里能够找到libsvm的文件 ?

软件包中有一个 README 文件，里面详细说明了所有参数选项、数据格式以及库函数的调用。在python目录下，模型选择工具和python界面的libsvm各有一个README文件。初学者可以通过A practical guide to support vector classification 了解如何训练和检验数据.论文LIBSVM : a library for support vector machines 详细讨论了libsvm的使用. [Go Top]

问: 以前版本的libsvm都有什么变化?
详见变化日志. 你可以到这里下载以前版本的libsvm . [Go Top]

问: 如果我想引用libsvm，我应该引用哪篇论文?
请引用以下论文: Chih-Chung Chang and Chih-Jen Lin, LIBSVM : a library for support vector machines, 2001. Software available at http://www.csie.ntu.edu.tw/~cjlin/libsvm bibtex格式如下：

@Manual{CC01a,
author =	 {Chih-Chung Chang and Chih-Jen Lin},
title =	 {{LIBSVM}: a library for support vector machines},
year =	 {2001},
note =	 {Software available at /url{http://www.csie.ntu.edu.tw/~cjlin/libsvm}}
}                                                                   [Go Top]

问: 如果我想在我的软件中应用svm，是否存在软件许可问题？
Libsvm许可文件 ("修改了的BSD许可文件") 和其他许多软件的许可文件都是兼容的，如 GPL. 因此你很容易就可以把libsvm应用到你的软件中，你还可以将它应用到商业产品中. [Go Top]

问: 是否有一系列基于libsvm的附加工具?
是的，详见libsvm tools [Go Top]

问: 在Unix操作系统中，出现了"error in loading shared libraries"（“在装载共享库时发生错误”）或者"cannot open shared object file."（无法打开共享目标文件“）这是为什么?
如果你在一台机器上编译代码，然后到另外一台有着不兼容库的机器上运行，这种情况酒会经常发生。你在那台机器上可以重新编译一下，或者用静态连接。 [Go Top]

问:修改源代码后，如果想在MS窗口中建立一个“svm-toy”的图形界面，我该怎么做？
你可以通过选择 "Win32 Project"来建立一个工程。另外对于"svm-train"和 "svm-predict" ，你需要选择"Win32 Console Project"。对于libsvm2.5以后的版本，你还可以通过Makefile.win来实现。详见README。

如果你没有用Makefile.win并出现了以下连接错误：LIBCMTD.lib(wwincrt0.obj) : error LNK2001: unresolved external symbol
_wWinMain@16
那么，你很有可能是选择了一个错误的工程类型。 [Go Top]

问: 我是MS Windows用户，在这些预编译的exe文件中，为什么只有一个(SVM_toy)运行? 你应当打开命令窗口，然后输入svmtrain.exe，这样就可以在DOS窗口中看到所有的选项了。你可以到README文件中看到一些例子 [Go Top]

问:为什么有时我在training/model 文件中看不到所有的数据属性呢？W
libsvm应用了所谓的”稀疏“格式，这样零值就不用存储了。例如，有下面属性的数据

1 0 2 0
将被替换为： 1:1 3:2                                                  [Go Top]

问:如果我的数据是非数值型的，可以用libsvm吗？ 目前libsvm只支持数值型的数据。因此，你必须将非数值型的转为数值型的数据。比如，你可以用二进制属性来替代原来的类别属性。

LibSVM 工具箱...不可分肿么办！

请教Matlab中svm libsvm工具箱分类问题

补充:在WindowsXP+OpenCVRC1平台下整合OpenCV与libSVM

常用libSVM资料链接

libsvm FAQ!!!!!!

“相关推荐”对你有帮助么？