【ML实验5】SVM（手写数字识别、核方法）

u小鬼

已于 2023-02-03 19:35:15 修改

阅读量1.6k

点赞数

分类专栏：机器学习文章标签：算法 svm 手写数字识别核方法

于 2022-12-21 16:03:09 首次发布

本文链接：https://blog.csdn.net/qq_23096319/article/details/128396458

版权

机器学习专栏收录该内容

21 篇文章 11 订阅

订阅专栏

实验代码获取 github repo
山东大学机器学习课程资源索引

实验目的

在这里插入图片描述

实验内容

在这里插入图片描述

这里并不是通过 KTT 条件转化，而是对偶问题和原问题为强对偶关系，可以通过 KTT 条件进行化简。

令 $x=\alpha=[\alpha_1,\alpha_2,...,\alpha_n]^T$ ，则有

$\sum^m_{i,j=1}\alpha_iy^{(i)}y^{(j)}<x^{(i)},x^{(j)}>\alpha_j$

$=\sum^m_{i=1}\sum^m_{j=1}\alpha_iy^{(i)}y^{(j)}<x^{(i)},x^{(j)}>\alpha_j$

$=\sum^m_{i=1}\alpha_i\sum^m_{j=1}y^{(i)}y^{(j)}<x^{(i)},x^{(j)}>\alpha_j$

令矩阵 $H$ 满足 $H_{ij}=y^{(i)}y^{(j)}<x^{(i)},x^{(j)}>$ ，则进一步

$=\sum^m_{i=1}\alpha_i\sum^m_{j=1}H_{ij}\alpha_j$

$=\sum^m_{i=1}\alpha_iH_{i}\alpha$

$=\alpha^TH\alpha=x^THx$

其实，基于同样的技巧， $H$ 矩阵可以写成 $H=Y^TXX^TY=(Y.*X)(Y.*X)^T$ .

其中， $XX^T)_{ij}=x^{(i)}(x^{(j)})^T=<x^{(i)},x^{(j)}>$ ，这里 $x^{(i)}$ 是行向量。

code 中将较小的 $a lp ha$ 默认为0，因为求解器用的是迭代方法，返回数值解，可能收敛到一个很小但不为0的值；
其他 $a lp ha$ 对应的是 support vector，代入公式计算 $\omega^*$ 和 $b^*$ .
在这里插入图片描述
code

    % 构建目标函数
    H = zeros(m);
    for i = 1 : m
        for j = 1 : m
            H(i, j) = y(i) * y (j) * x(i, :) * x(j, :)';
        end
    end
    % H = (y .* x) * (y .* x)';
    % H = (H + H') / 2;
    f = (-1) * ones(m, 1);
    % 构建约束
    Aeq = y';
    beq = 0;
    lb = zeros(m, 1);
    ub = zeros(m, 1);
    ub(:) = C;
    % 利用quadprog求解器求解对偶问题
    % quadprog(H,f,A,b,Aeq,beq,lb,ub)
    [alpha, fval] = quadprog(H, f, [], [], Aeq, beq, lb, ub);

    % 求support vector
    alpha(find(alpha < 1e-8)) = 0;
    sv = find(alpha > 0 & alpha < C);
    w = 0;  % omega
    for i = 1 : length(sv)
        w = w + alpha(sv(i)) * y(sv(i)) * x (sv(i), :)';
    end

    num = y - x * w;
    b = sum(num(sv)) / length(sv);

在 linear-separable 数据集上验证

在这里插入图片描述

正则项参数C变化，带来优化目标的“倾斜”，但是 margin 和 C 很难发掘出精确的代数关系（经过一个非线性问题的求解），只能说明它们的相关性。

在这里插入图片描述

做手写数字识别（仅有0和1）：

由于训练集太大，采用不重复采样：

m = length(x);
% 使用全部训练集，H矩阵大小为12665*12665，运算巨大，耗时较久
% 因此采样部分训练集，大小为tr_size
rp = randperm(m);
tr_size = 1000;
samp = rp(1 : tr_size);
x = x(samp, :); y = y(samp);
m = length(x);

在这里插入图片描述

核方法

在这里插入图片描述

预处理 kernal matrix，之后将 $x^{(i)},x^{(j)}>$ 替换为 $kma t (i, j)$ .

% 获取基于核函数Radial Basis Function计算的关系矩阵kmat
function kmat = get_kernel_mat(x, gamma)
    kmat = [];
    for i = 1 : length(x)
        for j = 1 : length(x)
            kmat(i, j) = exp(-gamma * norm(x(i, :) - x(j, :)) ^ 2);
        end
    end
end

之后，决策函数不直接计算，也无法计算，因为 mapping 函数具有无穷维度，实际上通过 $kma t$ 可以绕过直接计算 mapping ，如下图，实际就是代换 $\omega^*$ ，可以得到 $\phi^T(x^{(i)})\phi(x^{(j)})$ .

在这里插入图片描述

Mark the usage of contour func：
Here since vals only have two values 1 and -1，contour lines also become the boundaries.

    % Make classification predictions over a grid of values
    xplot = linspace(min(x(:, 1)), max(x(:, 1)), 100)';
    yplot = linspace(min(x(:, 2)), max(x(:, 2)), 100)';
    [X, Y] = meshgrid(xplot, yplot);
    vals = zeros(size(X));
    % For each point in this grid, you need to compute its decision
    % value. Store the decision values in vals.
	% ...
    hold on
    plot(x(pos, 1), x(pos, 2), '.r');
    plot(x(neg, 1), x(neg, 2), '.b');
    xlabel('x_1'); ylabel('x_2');
    str = strcat('\gamma=', num2str(gamma(t)));
    title(str);
    % Plot the SVM boundary
    colormap bone;
    contour(X, Y, vals, [0 0], 'LineWidth', 2);

u小鬼

关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
打赏
0
评论
【ML实验5】SVM（手写数字识别、核方法）

正则项参数C变化，带来优化目标的“倾斜”，但是 margin 和 C 很难发掘出精确的代数关系（经过一个非线性问题的求解），只能说明它们的相关性。之后，决策函数不直接计算，也无法计算，因为 mapping 函数具有无穷维度，实际上通过。默认为0，因为求解器用的是迭代方法，返回数值解，可能收敛到一个很小但不为0的值；可以绕过直接计算 mapping ，如下图，实际就是代换。这里并不是通过 KTT 条件转化，而是对偶问题和原问题为。，可以通过 KTT 条件进行化简。其实，基于同样的技巧，code 中将较小的。
复制链接

扫一扫