A holistic approach to semi-supervised learning

最新推荐文章于 2024-05-18 17:46:17 发布

SrdLaplaceGua

最新推荐文章于 2024-05-18 17:46:17 发布

阅读量457

点赞数

分类专栏：读书笔记程序

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/SrdLaplace/article/details/102589087

版权

读书笔记同时被 2 个专栏收录

37 篇文章 1 订阅

订阅专栏

10 篇文章 0 订阅

订阅专栏

Berthelot D, Carlini N, Goodfellow I, et al. Mixmatch: A holistic approach to semi-supervised learning[J]. arXiv preprint arXiv:1905.02249, 2019.
https://github.com/samihaija/mixhop

半监督学习的核心想法是利用无标注的数据来减轻对有标数据的需求。正则项可分为三类：一致性正则化、熵最小化和传统正则化。本文结合了这三种正则，消融实验表明MixMatch效果好于三个正则项每部分提升之和。

正则项

一致性正则化

分类器对于数据增强后的的数据的分类分布应该与之前的类别分布一样：
$||P(y|Augment(x);\theta)-p(y|x)||^2_2$

熵最小化

分类器的决策边界不应该穿过数据边缘分布的高密度区域：

显式的对unlabeled data加入 $P(y|x,\theta)$ 的熵作为损失函数
使用“sharpening”函数来隐式地实现熵的最小化

传统正则化

传统的正则化项位 L2 范数。本文的优化方法为Adam算法，使用权值衰减来替代L2损失项。

MixMatch

使用 MixMatch 生成数据，有标签的数据X和等量的无标数据U，和超参数：锐化（“sharpening”）参数T、对于无标数据强化K次和 Mixup 的参数 $\alpha$ 。
在这里插入图片描述

sharpening：

$sharpen(p,T)_i=\frac{p_i^{\frac{1}{T}}}{\sum_{j=1}^{L}p_j^{\frac{1}{T}}}$

MixUp

$\lambda=Beta(\alpha, \alpha)$

$\lambda^’=max(\lambda,1-\lambda)$

$x’=\lambda^’x_1+(1-\lambda^’)x_2$

$p’=\lambda^’p_1+(1-\lambda^’)p_2$

loss

$\alpha)$

$L_X=\frac{1}{|X’|}\sum_{x,p\in X’}H(p, p_{model}(y|x; \theta))$

$L_U = \frac{1}{L|U’|}\sum_{u,q\in U’}||q-p_{model}(y|x; \theta)||^2_2$

$L=L_X+\lambda_UL_U$

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
A holistic approach to semi-supervised learning

Berthelot D, Carlini N, Goodfellow I, et al. Mixmatch: A holistic approach to semi-supervised learning[J]. arXiv preprint arXiv:1905.02249, 2019.https://github.com/samihaija/mixhop半监督学习的核心想法是利用无标注的数...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。