半监督学习
监督学习
训练集的每一个数据已经有特征和标签(我们在进行文本分类的时候,训练数据为已经分好类别的语料)
有输入数据和输出数据通过学习训练集中输入数据和输出数据的关系,生成合适的函数,将输入映射到合适的输出。比如分类、回归。
半监督学习
在label data上面有另外一组unlabel data(只有input没有output)
训练集中一部分数据特征和标签,另一部分只有特征(只有输入没有输出),综合两类数据来生成合适的函数。【通常无标签的数据要多于有标签的数据】
目的:半监督学习要让学习器不依赖外界交互、自动的利用未标记数据来提升学习性能
关键:在于给未标记数据打上正确的标签
例如:
我们在生活中的学习就是半监督学习(比如从小孩开始,接触新事物的时候会先从父母那里得到一点信息,比若说看到一只狗,父母就会告诉我们这个是狗,也就是label,但是我们在一生中会看到很多种狗,我们会根据之前的知识去推断出来它是狗,这时是没有标签的,所以人类学习的过程就是半监督学习)
一种基于GCN的半监督学习模型
题目:SEMI-SUPERVISED CLASSIFICATION WITH GRAPH CONVOLUTIONAL NETWORKS
作者提出了一种可扩展式的半监督学习卷积神经网络方法处理基于图结构的数据。论文中作者所提出的方法应用的是关于图结构数据中的聚类问题。通过图结构数据中部分