SSVM（Structured Support Vector Machine）学习笔记

最新推荐文章于 2021-05-19 10:37:52 发布

Ottohcc

最新推荐文章于 2021-05-19 10:37:52 发布

阅读量1.4k

点赞数 2

分类专栏： SVM SSVM 文章标签：机器学习人工智能算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_40187381/article/details/109243421

版权

SSVM（Structured Support Vector Machine）学习笔记

本篇笔记主要是记录台湾大学李宏毅老师在 Structure Learning 课程中讲解的内容

http://speech.ee.ntu.edu.tw/~tlkagk/courses_ML16.html

什么是 Structure？

输入和输出中存在结构化数据的模型。（X：sentence，Y：tree structure）（X：Image，Y：bounding box）

1.Evaluate

定义一个 $F (x, y)$ ，一般是线性的，即 $F(s,y)=w*\phi(x,y)$ ，相当于打分函数。

$\phi(x,y)$ 一般是人工定义的，结果是一个向量，其中每一个维度代表一种特征（比如长短、相同字符的数目等），在 SSVM 训练时该函数不变，这一步往往比较难定义，所以后来有些人会使用神经网络自动训练出 $\phi(x,y)$ 。

$w$ 向量会在训练时改变。

2.Inference

Object Function（Structure 的推断就是穷举法，找出当前最契合的 $(x, y)$ 对）

$\tilde{y}=argmax_{y\in\mathbb{Y}}w*\phi(x,y）$

3.Training

对于所有的训练数据 ${(x^1,\widehat{y}^1),(x^2,\widehat{y}^2),...,(x^n,\widehat{y}^n),...,(x^N,\widehat{y}^N)}$ ，我们需要找到一个 $F (x, y)$ 使得
$\forall y\ne\widehat y^n\ \ \ , \ \ F(x^n,\widehat{y}^n)> F(x^n,y)$
线性可分（separable）

如果样本是线性可分的，那么可以采用结构化感知机（Structured Perceptron）算法：

输入：训练集合 $\{(x^1,\widehat{y}^1),(x^2,\widehat{y}^2),...,(x^n,\widehat{y}^n),...,(x^N,\widehat{y}^N)\}$
输出：符合要求的向量 $w$
算法：
- do：
  
  对于每一个训练集中的样本 $(x^n,\widehat{y}^n)$
  
  找到 label $\tilde{y}$

最低0.47元/天解锁文章

关注

2
点赞
踩
6

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。