在MATLAB中使用libSVM的方法

最新推荐文章于 2024-07-21 20:52:47 发布

给你一颗小糖块

最新推荐文章于 2024-07-21 20:52:47 发布

阅读量1.9k

点赞数 2

分类专栏：机器学习文章标签： matlab libsvm 分类器

本文链接：https://blog.csdn.net/u014574279/article/details/51554941

版权

机器学习专栏收录该内容

4 篇文章 0 订阅

订阅专栏

在MATLAB中使用libSVM的方法

libsvm库下载：http://www.csie.ntu.edu.tw/~cjlin/libsvm/

详解：http://www.matlabsky.com/thread-11925-1-1.html

安装libsvm方法，参考博客：http://blog.csdn.net/abcjennifer/article/details/7370177

先举一个栗子：

代码：

<span style="font-size:12px;"> clc,clear


%4个训练样本4*4，每个样本4条属性（特征）

train_data=[5.1 3.5 1.4 0.2;4.9 3.0 1.4 0.2;4.7 3.2 1.3 0.2;4.6 3.11.5 0.2];

%4个测试样本4*4，每个样本4条属性（特征）

test_data=[5.0 3.6 1.4 0.2;5.4 3.9 1.7 0.4;4.6 3.4 1.4 0.3;5.0 3.41.5 0.2];


train_labels=[1,1,2,2]';%训练样本标签4*1

test_labels=[1,1,1,1]';%测试样本标签4*1


model = svmtrain(train_labels, train_data);

[predict_label, accuracy,dec_values] =svmpredict(test_labels,test_data, model);

</span>

结果：

optimization finished, #iter = 2

nu = 1.000000

obj = -3.872840, rho = -0.009619

nSV = 4, nBSV = 4

Total nSV = 4

Accuracy = 75% (3/4) (classification)

1.分类问题处理整体正规流程

step1. 选定训练集和测试集 >>规范化 >> 特征提取

step2. 利用训练集训练分类器得到model

step3. 利用model对测试集进行预测

step4. 分类器性能评测[分类准确率的高低

2.svmtrain(… ) 通过训练集来训练模型

函数：model= svmtrain(train_label, train_matrix, ['libsvm_options']);

-train_label:

An m by 1 vector oftraining labels (type must be double). 标签数据应是m行1列的数据

-train_matrix:

An m by n matrix of mtraining instances with n features.

It can be dense or sparse(type must be double). 训练数据应是m行n列，m表示样本数，n表示1个样本有n中属性

-libsvm_options:

A stringof training options in the same format as that of LIBSVM. 是一个字符串如：'-c 2 -g 0.02 -t 2'

Options：可用的选项即表示的涵义如下：

-ssvm类型：SVM设置类型(默认0)

0 -- C-SVC(C-support vector classification)

1 -- nu-SVC(nu-support vectorclassification)

2 -- one-class SVM (distributionestimation) 一类SVM

3 -- epsilon-SVR(epsilon-support vectorregression)

4 -- nu-SVR (nu-support vectorregression)

　　-t核函数类型：核函数设置类型(默认2)

　　 0 – 线性：u'v

　　 1 – 多项式：(r*u'v+ coef0)^degree

　　 2 – RBF函数：exp(-r|u-v|^2)

　　 3 –sigmoid：tanh(r*u'v+ coef0)

　　-d degree：核函数中的degree设置(针对多项式核函数)(默认3)

　　-g r(gama)：核函数中的gamma函数设置(针对多项式/rbf/sigmoid核函数)(默认1/k)

　　-r coef0：核函数中的coef0设置(针对多项式/sigmoid核函数)((默认0)

　　-c cost：设置C-SVC，e-SVR和v-SVR的参数(损失函数)(默认1)

　　-n nu：设置v-SVC，一类SVM和v-SVR的参数(默认0.5)

　　-p p：设置e -SVR 中损失函数p的值(默认0.1)

　　-m cachesize：设置cache内存大小，以MB为单位(默认40)

　　-e eps：设置允许的终止判据(默认0.001)

　　-h shrinking：是否使用启发式，0或1(默认1)

　　-wi weight：设置第几类的参数C为weight?C(C-SVC中的C)(默认1)

　　-v n: n-fold交互检验模式，n为fold的个数，必须大于等于2

其中-g选项中的k是指输入数据中的属性数。option-v 随机地将数据剖分为n部分并计算交互检验准确度和均方根误差。以上这些参数设置可以按照SVM的类型和核函数所支持的参数进行任意组合，如果设置的参数在函数或SVM类型中没有也不会产生影响，程序不会接受该参数；如果应有的参数设置不正确，参数将采用默认值。

model：SVM根据样本训练的得到的分类器

model是struct结构[Parameters, nr_class,totalSV, rho, Label, ProbA, ProbB, nSV, sv_coef, SVs]

model.Parameters参数（均是用户自定义或者默认的）意义从上到下依次为：

-s svm类型：SVM设置类型(默认0)

-t 核函数类型：核函数设置类型(默认2)

-d degree：核函数中的degree设置(针对多项式核函数)(默认3)

-g r(gama)：核函数中的gamma函数设置(针对多项式/rbf/sigmoid核函数)(默认类别数目的倒数)

-r coef0：核函数中的coef0设置(针对多项式/sigmoid核函数)((默认0)

model.nr_class表示数据集中有多少类别；=2 for regression/one-class svm

model.Label表示数据集中类别的标签都是什么

model.totalSV代表总共的支持向量的数目

model.nSV表示每类样本的支持向量的数目