%%清空环境变量
clear all
clc
%%导入数据
load BreastTissue_data.mat
%%随机产生训练集和测试集
n=randperm(size(matrix,1));
%%matlab中,size(A,1)返回的是矩阵A所对应的行数。
%%size(A,2) 该语句返回的时矩阵A的列数。 randperm函数 随机打乱一个数 n = randperm(size(matrix, 1)); % 随机打乱矩阵的行数
%%
% 2. 训练集——80个样本
train_matrix = matrix(n(1:80),:);取前80行
train_label = label(n(1:80),:);
%%
% 3. 测试集——26个样本
test_matrix = matrix(n(81:end),:);
test_label = label(n(81:end),:);
%% III. 数据归一化 http://www.ilovematlab.cn/thread-263799-1-1.html
[Train_matrix,PS] = mapminmax(train_matrix');
Train_matrix = Train_matrix';
Test_matrix = mapminmax('apply',test_matrix',PS);
Test_matrix = Test_matrix';
在MATLAB主窗口中输入[train_matrix,PS]=mapminmax(train_matrix'),这里PS是一种对应关系,里面包括一些相应的特征值。
MATLAB 帮助文档中告诉我们,这种对应关系是
y = (ymax-ymin)*(x-xmin)/(xmax-xmin) + ymin
。。。。。略
具体参考:https://jingyan.baidu.com/article/48b37f8d649ce31a646488e9.html
%% IV. SVM创建/训练(RBF核函数)
%%
% 1. 寻找最佳c/g参数——交叉验证方法
[c,g] = meshgrid(-10:0.2:10,-10:0.2:10);%%粗网格法 https://blog.csdn.net/foreverhuylee/article/details/32731349形成长宽各为101的矩阵c和g
[m,n] = size(c);%%求出c矩阵的长和宽
cg = zeros(m,n);%形成101行 101列的0矩阵
eps = 10^(-4);
v = 5;
bestc = 1;
bestg = 0.1;
bestacc = 0;
for i = 1:m
for j = 1:n
cmd = ['-v ',num2str(v),' -t 2',' -c ',num2str(2^c(i,j)),' -g ',num2str(2^g(i,j))];%%‘-t 2’多项式核
cg(i,j) = svmtrain(train_label,Train_matrix,cmd);
if cg(i,j) > bestacc
bestacc = cg(i,j);
bestc = 2^c(i,j);
bestg = 2^g(i,j);
end
if abs( cg(i,j)-bestacc )<=eps && bestc > 2^c(i,j)
bestacc = cg(i,j);
bestc = 2^c(i,j);
bestg = 2^g(i,j);
end
end
end
cmd = [' -t 2',' -c ',num2str(bestc),' -g ',num2str(bestg)];
%%
% 2. 创建/训练SVM模型
model = svmtrain(train_label,Train_matrix,cmd);
%% V. SVM仿真测试
[predict_label_1,accuracy_1,decision_values] = svmpredict(train_label,Train_matrix,model);
[predict_label_2,accuracy_2,decision_values] = svmpredict(test_label,Test_matrix,model);
result_1 = [train_label predict_label_1];
result_2 = [test_label predict_label_2];
%% VI. 绘图
figure
plot(1:length(test_label),test_label,'r-*')
hold on
plot(1:length(test_label),predict_label_2,'b:o')
grid on
legend('真实类别','预测类别')
xlabel('测试集样本编号')
ylabel('测试集样本类别')
string = {'测试集SVM预测结果对比(RBF核函数)';
['accuracy = ' num2str(accuracy_2(1)) '%']};
title(string)