【每日机器学习】之SVM之分类间隔

NTFY 超得屁(°∀°)ﾉ

于 2023-08-27 04:27:54 发布

阅读量145

点赞数 1

文章标签：机器学习支持向量机分类

本文链接：https://blog.csdn.net/weixin_46143783/article/details/132499302

版权

关于支持向量机SVM，下列说法错误的是()
A. L2正则项，作用是最大化分类间隔，使得分类器拥有更强的泛化能力
B. Hinge损失函数，作用是最小化经验分类错误
C. 分类间隔为 $\frac{1}{||w||},||w||$ 代表向量的模
D. 当参数C越小时，分类间隔越大，分类错误越多，趋于欠学习

分类间隔为 $\frac{2}{||w||}$

详细见下图
在这里插入图片描述
各选项：
选项A. L2正则项，作用是最大化分类间隔，使得分类器拥有更强的泛化能力
L2正则项： $\underset{\mathbf{w},b}{\text{minimize}}{||\mathbf{w}||_2^2}$
选项B. Hinge损失函数，作用是最小化经验分类错误
$\textbf {hinge loss function:}\text{max}(0,1-y_i(\mathbf{w}^{\intercal}\mathbf{x}_i-b))$
优化目标：
$\underset{\mathbf{w},b,\zeta} {\text{minimize}} \hspace{8pt}||\mathbf{w}||^2_2+C \underset{i=1}{\overset{n}\sum}\zeta_i$
$\text{subject to}\hspace{6pt}y_i(\mathbf{w}^\intercal\mathbf{x_i}-b)\ge1-\zeta_i,\zeta_i\ge0,\forall i \in\{1,...,n\}$

选项D. 当参数C越小时，分类间隔越大，分类错误越多，趋于欠学习
考虑Lagrange目标函数
$L=\frac{1}{2}\mathbf{||w||}^2-\sum\alpha_i[y_i(\mathbf{w^\intercal x}+b)-1]$
$\frac{\partial L}{\partial \mathbf{w}}=\mathbf{w}-\sum\alpha_iy_i\mathbf{x}_i=0\Rightarrow\mathbf{w}=\underset{i}\sum\alpha_iy_i\mathbf{x}_i$
$\frac{\partial L}{\partial b }=-\sum\alpha_iy_i=0\Rightarrow\sum\alpha_iy_i=0$
$L=\frac{1}{2}(\sum\alpha_iy_i\mathbf{x}_i)(\sum\alpha_jy_j\mathbf{x}_j)-\sum\alpha_iy_i\mathbf{x}_i\cdot(\sum\alpha_jy_j\mathbf{x}_j)-\sum\alpha_iy_ib+\sum\alpha_i$
$=\sum\alpha_i-\frac{1}{2}\underset{i}\sum\underset{j}\sum\alpha_i\alpha_jy_iy_j\mathbf{x}_i\cdot\mathbf{x}_j$
$\therefore\sum\alpha_iy_i\mathbf{x}_i\cdot\mathbf{x}_j+b\gt0,\text{plus samples}$
$\hspace{9pt}\sum\alpha_iy_i\mathbf{x}_i\cdot\mathbf{x}_j+b\lt0,\text{minus samples}$
$C=\alpha_i+\mu_i\mathbf{_{[1]}}$
C作为惩罚因子，C越大确保准确度越大，牺牲间隔，反之亦然。