未登录词处理优秀论文——Pointing the Unknown Words

这篇论文提出了一种处理低频词和未登录词的方法,通过注意力模型和pointer softmax,分别用location softmax和shortlist softmax来处理。文章介绍了如何确定何时使用哪种softmax,并通过切换网络解决策略选择问题。此外,论文还应用了大型词汇技巧进行训练。
摘要由CSDN通过智能技术生成

论文:
《Pointing the Unknown Words》
作者:
Caglar Gulcehre、Sungjin Ahn、Ramesh Nallapati、Bowen Zhou、Yoshua Bengio


这篇论文主要是解决低频词和未出现(在测试集中)词的问题——统称“未登录词问题”。
采用了注意力模型。本文的思想是在遇到未登录词时,不要简单的将其记作:UNK,而是将未登录词分作两种情况:

  • 第一种情况是可以在预设的词表中找到相似的词
  • 第二种情况是可以使用原语句中的某个词进行替代(如下图)

这里写图片描述

所以根据这样的假设,本文使用了两个softmax层:

  • 一个用于预测原输入语句中某个词的位置,对应于用原语句中的某个词替换,叫做location softmax
  • 另一个用于预测在预定词表中的单词,叫做shortlist softmax

文中提到一般对于未登录词的处理分为三类:

  1. 提高softmax的计算速度,使得模型能够拥有更大的词表。 相关方法:层次softmaxÿ
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值