半监督学习理解

最新推荐文章于 2024-07-25 12:14:33 发布

In year

最新推荐文章于 2024-07-25 12:14:33 发布

阅读量390

点赞数 5

分类专栏：深度学习文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_49288362/article/details/136379308

版权

深度学习专栏收录该内容

11 篇文章 0 订阅

订阅专栏

半监督

少量有标注，大量无标注

1.三个假设：

(1)连续性/平滑性假设：相近的数据点可能有相同的标签

(2)集群假设：在分类问题中，数据往往被组织成高密度的集群，同一集群的数据点可能具有相同的标签。因此，决策边界不应该位于密集的数据点区域；相反，它应该位于高密度区域之间，将它们分离成不连续的群组。

(3)流形假设：高纬数据分布可以在一个嵌入式的低纬空间中表示。这个低纬空间被称为数据流形。

2.方法：

（1）一致性正则化：

核心动机：利用连续性和集群假设

具体操作：对于一个给定的特征x，我们的模型应该对潜在Augment（x）半径内的所有数据点做出类似的预测。即加扰动不影响输出。（我们选中x。那么x和x周围的类别是一致的）

实现方法：

正规全监督+ $x_i$ 和 $x_i$ 附近的数据点的差距（差距不大）
$\left.loss=\left\{\begin{matrix}CrossEntropy(x_i,y_i)+\|f_\theta(x_i)-f_\theta(Augment(x_i))\|_2^2,x_i\in X_{labeled}\\\|f_\theta(x_i)-f_\theta(Augment(x_i))\|_2^2,x_i\in X_{unlabled}\end{matrix}\right.\right.$

(2)伪标签

核心动机：把半监督问题转换成全监督

具体操作：想办法得到伪标签

(3)生成对抗网络

核心动机：用鉴别器找到值得信赖的区域

(4)主动学习

核心动机：识别哪些未标记的点是最有价值的，由人在循环中进行标记。

关注

5
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
半监督学习理解

(2)集群假设：在分类问题中，数据往往被组织成高密度的集群，同一集群的数据点可能具有相同的标签。相反，它应该位于高密度区域之间，将它们分离成不连续的群组。具体操作：对于一个给定的特征x，我们的模型应该对潜在Augment（x）半径内的所有数据点做出类似的预测。那么x和x周围的类别是一致的）(3)流形假设：高纬数据分布可以在一个嵌入式的低纬空间中表示。核心动机：识别哪些未标记的点是最有价值的，由人在循环中进行标记。(1)连续性/平滑性假设：相近的数据点可能有相同的标签。附近的数据点的差距（差距不大）
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。