李宏毅结构化学习 02

撸码侠

于 2024-09-16 15:31:09 发布

阅读量446

点赞数 10

分类专栏：李宏毅结构化学习文章标签：人工智能机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42830015/article/details/142176683

版权

李宏毅结构化学习专栏收录该内容

2 篇文章 0 订阅

订阅专栏

文章目录

一、上篇博文复习
二、Separable Case
三、Non-separable Case
四、Considering Errors
五、Regularization
六、Structured SVM
七、Cutting Plane Algorithm for Structured SVM
八、Multi-class and binary SVM
九、Beyond Structured SVM

一、上篇博文复习

在这里插入图片描述

在这里插入图片描述

图中x表示输入的图片，y表示边界框， $\phi (x,y)$ 表示由x,y确定的特征强度，w表示需要训练学习的权重，
在这里插入图片描述
F(x,y)如果是线性的，是有很大的局限性。但如果F(x,y)不是线性的，本篇文章的后续推论，可能都不成立。所以这是一个尚待解决的问题。

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

二、Separable Case

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
也就是和y的个数没有关系。

在这里插入图片描述

$\rho$ 是两个向量的夹角，范围是[0, $\pi$ ]，所以 $\rho$ 越小， $\cos \rho$ 就越大。
在这里插入图片描述

在这里插入图片描述
这里只证明的 $\cos \rho$ 的分子随着k的增大而增大，还需要看看分母是什么情况。

在这里插入图片描述

在这里插入图片描述

所有feature扩大两边，并不能加快训练。因为 $\delta$ 扩大两倍的同时，R也扩大了两倍。

在这里插入图片描述

三、Non-separable Case

在实际问题中很难找到Separable case的情况，即很难找到feature可以让正确和错误的分离，也不知道怎么找到它，所以要考虑Non-separable Case。

在这里插入图片描述

在这里插入图片描述
C的最小值是零。

在这里插入图片描述

在这里插入图片描述
除了边界值不能微分，其他地方都能微分。

在这里插入图片描述

四、Considering Errors

在这里插入图片描述
我们希望所选的 $w$ , 使得y与正确的那个越接近，计算的 $\cdot \phi$ ,越大，即与正确的越接近。
这样做的好处是，即使testing和training有一些差距，即使testing的第一名不是正确的，但是所输出的第一名和正确的差距不会很大。

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
上界 C 变小，可能会使 C’ 随之也变小。

在这里插入图片描述

在这里插入图片描述

五、Regularization

在这里插入图片描述

在这里插入图片描述

六、Structured SVM

在这里插入图片描述
因为我们要最小化C，所以上图中的倒数第三行和倒数第二行等价的。

请添加图片描述

习惯上，这时我们就把 $C^n$ 写为 $\varepsilon^n$
在这里插入图片描述
本来是找w，去最小化C。即找到w后， $C^n$ 就被决定了。
但是在黄色框中，定好w后， $\varepsilon^n$ 并不能确定。所以条件要改成：Find $w,\varepsilon^1,\cdots,\varepsilon^n$ minimizing C

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
由于约束条件，即不等式太多，可能会令w找不到，所以要放宽条件，不等式右边减去一个 $\varepsilon$ ( $\varepsilon \ge0$ )。但 $\varepsilon$ 又不能太大，否则w取任何值都能满足不等式，约束条件就失去意义了。

在这里插入图片描述

在这里插入图片描述

七、Cutting Plane Algorithm for Structured SVM

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

下面以 object detection 为例：

在这里插入图片描述

在这里插入图片描述
这里相当于 $\bar y$ 是有个函数公式，给定w后，直接能算出来哪个y最大。

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

八、Multi-class and binary SVM

在这里插入图片描述
这里y代表类别。y为哪个类别，就把 $\vec x$ 放在 $\phi(x,y)$ 对应的维度上。

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
这里我们可以定义，只要类别不一样就定义为 $\Delta (\widehat y^n,y)=1$

九、Beyond Structured SVM

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

关注

10
点赞
踩
17

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。