第09课:RNN 在序列问题中的应用——序列标注

在前两节课的内容中,我们介绍了循环神经网络及变种的基本原理,并介绍了 Many-to-One 和 One-to-Many 两种架构下,如何基于 Deeplearning4j 进行文本分类和文本生成的应用。

本节课开始,我们将继续为大家介绍另外一种架构,Many-to-Many 在序列标注和机器翻译问题中的应用。这两类问题是 NLP 中的经典问题。尤其对于序列标注问题来说,分词、实体识别、句法分析都可以基于序列标注进行。这里介绍的也是平时企业中最常见的问题——分词。本节课核心内容包括:

  • 基于 Many-to-Many 架构的序列标注应用

9.1 基于 Many-to-Many 架构的序列标注应用

序列标注是自然语言处理应用中常见的问题。基于序列标注的思想,我们可以解决分词、实体识别、浅层句法分析等实际应用。序列标注在以往一般会依赖于 HMM、CRF 等模型来实现,并且已经可以达到产品级别的准确率。基于神经网络的方法目前也有很多工作和研究成果,虽然在准确性上不一定有质的飞跃,但端到端的思想可以体现得更为彻底,毕竟类似 CRF 的模型设计特征模版需要做比较大量的预研工作。

下面我们就详细介绍下如何基于 Deeplearning4j 中的 LSTM 结构来实现分词的问题。使用的架构是 Many-to-Many。我们先来看下示意图。

enter image description here

从截图中我们可以清楚地看到,每一个 RNN Cell 输出的结果即为我们的标注序列。和之前讲述的 Many-to-One/One-to-Many 不同,在 Many-to-Many 架构中,输出和输出的序列都是我们关心的。在分词的场景中,我们可以用最简单的 BESM

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

wangongxi

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值