主动学习、纯半监督学习与直推学习

最新推荐文章于 2023-03-12 20:09:39 发布

萧甬学者

最新推荐文章于 2023-03-12 20:09:39 发布

阅读量3.1k

点赞数 4

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/daringpig/article/details/79558699

版权

机器学习专栏收录该内容

15 篇文章 0 订阅

订阅专栏

主动学习、纯半监督学习与直推学习

本文主要介绍主动学习、纯半监督学习与直推学习的概念：

主动学习(active learning)
纯半监督学习(semi-supervised learning）
直推学习(transductive learning)

引言

看论文时，看到了transductive learning相关的概念，由于是第一次接触，想先找个教材看看，就翻看了周志华老师的《机器学习》，但是很遗憾，还是没怎么理解，于是从网上找了一些资料，共享一下，以飨观众。

主动学习（active learning）

主动学习指的是这样一种学习方法：大多数情况下，有类标的数据比较稀少而没有类标的数据是相当丰富的，但是对数据进行人工标注又非常昂贵，这时候，学习算法可以主动地提出一些标注请求，将一些经过筛选的数据提交给专家进行标注。这个筛选过程也就是主动学习主要研究的地方了。

半监督学习（semi-supervised learning）

半监督学习特指的是学习算法不需要人工干预，基于自身对未标记数据加以利用，来提高学习模型的泛化性能。

一般认为半监督学习包含“纯半监督学习(pure semi-supervised learning和直推学习(transductive learning)。

三者之间的联系：

主动学习、纯半监督学习、直推学习都属于利用未标记数据的学习技术，只是其基本思想不同。

三者之间的区别：

主动学习与半监督学习的区别:

主动学习的主动指的是主动提出标注请求，也就是说还需要一个外在的能够对其进行标注的实体(通常是相关人员)，即主动学习是交互进行的。其目标是使用尽量少的“查询”(query)来获得尽量好的性能。主动学习引入了额外的专家知识，用过与外界的交互来将部分未标记样本转变为有标记样本。

纯半监督学习与直推学习的区别：

假设有如下的数据集，其中训练集为 $X_L$ 和 $X_U$ ，测试集为 $X_{test}$ ,标记样本数目为L,未标记样本数目为U，L<<U

标记样本( $X_L$ , $Y_L$ )={ $X_{1:L}$ , $Y_{1：L}$ }　　
未标记样本 $X_U$ ={ $X_{L+1:U}$ },训练时可用
测试样本 $X_{test}$ ={ $X_{U+1:}$ },只有在测试时才可以看到

纯半监督学习是一种归纳学习(inductive learning),可以对测试样本 $X_{test}$ 进行预测。也即纯半监督学习是基于“开放世界”的假设。

直推学习是transductive learning，仅仅可以对未标记样本 $X_U$ 进行标记，模型不具备对测试样本 $X_{test}$ 进行泛化的能力。直推学习是基于“封闭世界”的假设。

直推学习假设未标记的数据就是最终要用来测试的数据，学习的目的就是在这些数据上取得最佳泛化能力。相对应的，纯半监督学习在学习时并不知道最终的测试用例是什么。

[1]: 周志华《机器学习》

关注

4
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
主动学习、纯半监督学习与直推学习

主动学习、纯半监督学习与直推学习本文主要介绍主动学习、纯半监督学习与直推学习的概念：主动学习(active learning)纯半监督学习(semi-supervised learning）直推学习(transductive learning)引言看论文时，看到了transductive learning相关的概念，由于是第一次接触，想先找个教材看看，就翻看了...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。