【论文阅读】Intrinsically semi-supervised methods

来日可期1314

已于 2022-07-25 05:00:51 修改

阅读量673

点赞数

分类专栏： SSL 论文阅读文章标签：半监督一致正则化扰动

于 2022-06-24 15:00:11 首次发布

本文链接：https://blog.csdn.net/ssjq123/article/details/125445575

版权

论文阅读同时被 2 个专栏收录

29 篇文章 0 订阅

订阅专栏

SSL

7 篇文章 2 订阅

订阅专栏

1 Maximum-margin methods

这个分类里面的经典的就是将SVM从有监督迁移到半监督，考虑无标记样本构造最佳超平面。这个方法偏数学，在这里就不详细介绍了。

2 Perturbation-based methods

基于扰动的方法，感觉这个方法产生的原因很简单，无标记样本没有标签，那么无论是回归还是分类，都没有对错之分，那么怎么产生一种损失的概念加入到目标函数中呢？

Answer: 训练两个网络，这里需要一些tricks来使得两个网络有差异，总之就是不能一样，不然两个模型的预测一样，损失就没有意义了。扰动就是这样的一个trick，比较常见的就是在模型的每一层添加噪声。

2.1 Ladder networks

传送门

2.2 Pseudo-ensembles

相比于上一个模型(Ladder networks)是对数据做扰动，这个模型则是对模型进行扰动。文中叙述，对于以神经网络为基础实现的模型，一种突出的扰动模型的方法是Dropout。这个概念理解应该比较普遍，在这里还是赘述一下，就是在神经网络的训练过程中按照某种策略丢掉一些神经元连接(不在是全连接的状态)，这种丢掉的策略就是Dropout。

$\begin{aligned} &\underset{\xi \sim \Xi}{\mathbb{E}}\left[\frac{1}{l} \cdot \sum_{i=1}^{l} \mathcal{L}\left(\tilde{f}_{\boldsymbol{\theta}}\left(\mathbf{x}_{i} ; \xi\right), y_{i}\right)\right] \\ &\quad+\underset{\xi \sim \Xi}{\mathbb{E}}\left[\frac{1}{n} \cdot \sum_{i=1}^{n} \sum_{k=2}^{K} \lambda_{k} \cdot \mathcal{V}_{k}\left(f_{\boldsymbol{\theta}}^{k}\left(\mathbf{x}_{i}\right), \tilde{f}_{\boldsymbol{\theta}}^{k}\left(\mathbf{x}_{i} ; \xi\right)\right)\right] \end{aligned}\tag{1}$
等式1，表示的是Pseudo-ensembles模型的损失函数，是一种比较宽泛的表达，其中没有明确规定对于模型扰动的具体实现方法。从中可以得知，损失函数分为两部分，第一个部分表示有监督部分的损失，第二个部分表示无监督部分的损失。值得注意的是，其中无监督损失表达的是未标记数据点对于扰动网络的一致性。

2.2.1 $\mathrm{\Pi}$ -model 和 Temporal ensembling

传送门

2.2.2 Mean Teacher

传送门

2.2.3 Virtual adversarial training

3 Manifolds

4 Generativemodels

来日可期1314

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
【论文阅读】Intrinsically semi-supervised methods

算法直接优化带有标记和未标记样本组件的目标函数，这些我们称之为本质上半监督的方法，不依赖于任何中间步骤或有监督的基础学习器。通常，它们是现有监督方法的扩展，以在目标函数中包含未标记的样本。...............
复制链接

扫一扫