弱监督学习

最新推荐文章于 2024-06-19 13:03:43 发布

Losteng

最新推荐文章于 2024-06-19 13:03:43 发布

阅读量1.7w

点赞数 1

分类专栏： machine learning

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/losteng/article/details/51156119

版权

machine learning 专栏收录该内容

24 篇文章 3 订阅

订阅专栏

今天看到一个新名词弱监督学习，查了一下，原来是由来已久的知识，下面就科普一下吧

弱监督学习

文章给的定义是：数据集的标签是不可靠的，如（x，y），y对于x的标记是不可靠的。

这里的不可靠可以是标记不正确，多种标记，标记不充分，局部标记等。

在实际应用中的学习问题往往以混合形式出现,如多标记多示例、半监督多标记、弱标记多标记等。针对监督信息不完整或不明确对象的学习问题统称为弱监督学习

弱监督学习可以看做是有多个标记的数据集合，次集合可以是空集，单个元素，或是多个元素的

分别表示x没有标记，有一个标记，和有多个标记。在此统一声明为一个标记的集合。

在实际的使用中多标记的使用是很常见的，在图像文本语音中是很容易找到多个标记的。

举个图像中的例子

一般机器学习算法，每一个训练样本都需要类别标号（对于二分类：1/-1）。实际上那样的数据其实已经经过了抽象，实际的数据要获得这样的标号还是很难，图像就是个典型。还有就是数据标记的工作量太大，我们想偷懒了，所以多只是给了正负样本集。负样本集里面的样本都是负的，但是正样本里面的样本不一定都是正的，但是至少有一个样本是正的。比如检测人的问题，一张天空的照片就可以是一个负样本集；一张某某自拍照就是一个正样本集（你可以在N个区域取N个样本，但是只有部分是有人的正样本）。这样正样本的类别就很不明确，传统的方法就没法训练。

疑问来了，图像的不是有标注吗？有标注就应该有类别标号啊?这是因为图片是人标的，数据量特大，难免会有些标的不够好,这就是所谓的弱监督集（weakly supervised set）。所以如果算法能够自动找出最优的位置，那分类器不就更精确吗？标注位置不是很准确，这个例子不是很明显，还记得前面讲过的子模型的位置吗？比如自行车的车轮的位置，是完全没有位置标注的，只知道在bounding box区域附件有一个车轮。不知道精确位置，就没法提取样本。这种情况下，车轮会有很多个可能的位置，也就会形成一个正样本集，但里面只有部分是包含轮子的。

弱监督学习多用在多标记的数据上，感兴趣的可以去看一下

《Weaklysupervised discriminative location and classification: a joint learning process》

关注

1
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
弱监督学习

今天看到一个新名词弱监督学习，查了一下，原来是由来已久的知识，下面就科普一下吧弱监督学习文章给的定义是：数据集的标签是不可靠的，如（x，y），y对于x的标记是不可靠的。这里的不可靠可以是标记不正确，多种标记，标记不充分，局部标记等。在实际应用中的学习问题往往以混合形式出现,如多标记多示例、半监督多标记、弱标记多标记等。针对监督信息不完整或不明确对象的学习问题统称为弱监督学习
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。