论文阅读:Diverse Beam Search--Decoding Diverse Solutions from Neural Sequence Models

本文介绍了Diverse Beam Search算法,作为对传统Beam Search的改进,旨在解决自然语言处理中输出多样性不足的问题。在智能客服对话系统、图像标题生成等领域,DBS能提供更丰富和准确的输出,提高模型的实用性和效果。
摘要由CSDN通过智能技术生成

      因为最近一个实验室项目即将开始,关于给中国移动公司做一个智能客服对话系统,所以这段时间我开始搜集相关的最新论文开始阅读,今天给大家带来的是<<Diverse Beam Search--Decoding Diverse Solutions from Neural Sequence Models>>


      Neural Sequence Model(RNN、LSTM)常用来处理有时序性的数据。目前在decode的过程中经常会使用beam search算法,这个算法类似于贪心算法,在每个时刻输出后会保留概率前k大的序列,其它的舍弃掉。举个例子,在t-1时刻我们经过筛选已经有了k个序列,那么在t时刻,我们的输出会有k×n个序列(其中n是单词库的总数)。然后我们选取其中概率前k大的序列,其余的全部舍弃掉。不断重复这样的做法,直到输出结束。但是beam search有个最大的问题是其输出的k个句子之间差异性很小(这样就相当于耗费巨大时间输出的结果基本相似),这样造成了计算的浪费,并且不能体现实际语言的多样性(比如在image captioning中,针对一张图片应该会有好多种描述方式的,而不仅仅局限于一种两种)。而这篇论文提出了diverse beam search算法,相当于对beam search算法的改进。经过实验证明,这种算法会使得输出多样性和准确性都大幅提高,而且DBS算法有很广阔的应用领域,包括image captioning、machine translation、conversation、visual question generation等。   

   

       在decode过程中,假设我们的单词表共有N个单词,

  • 2
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值