【论文浅析】Semi-supervised sequence tagging with bidirectional lm

本文对Semi-supervised sequence tagging with bidirectional language models一文做一个简短介绍,该文发表在ACL2017.

一、任务介绍

利用语言模型学习得到的RNN表示,来增强有监督的序列标注任务。

往往序列标注的数据集是有限的,在有限的数据下,模型很难学习到一个足够好的embedding来表示单词。

本文通过语言模型可以利用到大量没有标注的数据,来增强单词的语义表示。

二、模型

做法也很简单,

1)第一步用大量的未标注数据进行前向和反向语言模型的训练,预训练好两个RNN网络。

2)对于给定句子中每一个单词,例如“New”,先得到单词的embedding表示,然后经过第一层双向RNN,得到隐层表示。

这个时候该句子经过预训练好的两个RNN网络,得到New的前后RNN输出表示,与之前的网络隐层进行拼接,输入到第二层RNN网络中,进行序列标注。

比起正常的序列标注模型来,多了一个拼接预训练好语言模型的输出表示。这一块多余的东西还不用标注,岂不妙哉。

三、实验

主实验如table1所示,我们可以看出,性能从90.87提高了91.93,增加了一个多点,效果还是挺明显的。

至于语言模型的输出到底加在RNN的哪一层,作者也做了实验:

发现加在第一层RNN的输出的时候结果最好,不要问为什么,问了就是炼丹。

四、贡献

本文没有在基本的序列标注模型再继续搞一些fancy的骚结构,或者其它怼模型的操作,而是采用半监督方法创新的利用大量没有标注的数据来提高性能,很nice。

整篇文章通俗易懂,赏心悦目。

PS:如果觉得本文对你有任何帮助,希望右下角点个【在看】,谢谢。

往期精彩回顾




适合初学者入门人工智能的路线及资料下载机器学习在线手册深度学习在线手册AI基础下载(pdf更新到25集)备注:加入本站微信群或者qq群,请回复“加群”获取一折本站知识星球优惠券,请回复“知识星球”

喜欢文章,点个在看

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Semi-supervised classification with graph convolutional networks (GCNs) is a method for predicting labels for nodes in a graph. GCNs are a type of neural network that operates on graph-structured data, where each node in the graph represents an entity (such as a person, a product, or a webpage) and edges represent relationships between entities. The semi-supervised classification problem arises when we have a graph where only a small subset of nodes have labels, and we want to predict the labels of the remaining nodes. GCNs can be used to solve this problem by learning to propagate information through the graph, using the labeled nodes as anchors. The key idea behind GCNs is to use a graph convolution operation to aggregate information from a node's neighbors, and then use this aggregated information to update the node's representation. This operation is then repeated over multiple layers, allowing the network to capture increasingly complex relationships between nodes. To train a GCN for semi-supervised classification, we use a combination of labeled and unlabeled nodes as input, and optimize a loss function that encourages the network to correctly predict the labels of the labeled nodes while also encouraging the network to produce smooth predictions across the graph. Overall, semi-supervised classification with GCNs is a powerful and flexible method for predicting labels on graph-structured data, and has been successfully applied to a wide range of applications including social network analysis, drug discovery, and recommendation systems.
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值