论文阅读:Diverse Beam Search--Decoding Diverse Solutions from Neural Sequence Models

      因为最近一个实验室项目即将开始,关于给中国移动公司做一个智能客服对话系统,所以这段时间我开始搜集相关的最新论文开始阅读,今天给大家带来的是<<Diverse Beam Search--Decoding Diverse Solutions from Neural Sequence Models>>


      Neural Sequence Model(RNN、LSTM)常用来处理有时序性的数据。目前在decode的过程中经常会使用beam search算法,这个算法类似于贪心算法,在每个时刻输出后会保留概率前k大的序列,其它的舍弃掉。举个例子,在t-1时刻我们经过筛选已经有了k个序列,那么在t时刻,我们的输出会有k×n个序列(其中n是单词库的总数)。然后我们选取其中概率前k大的序列,其余的全部舍弃掉。不断重复这样的做法,直到输出结束。但是beam search有个最大的问题是其输出的k个句子之间差异性很小(这样就相当于耗费巨大时间输出的结果基本相似),这样造成了计算的浪费,并且不能体现实际语言的多样性(比如在image captioning中,针对一张图片应该会有好多种描述方式的,而不仅仅局限于一种两种)。而这篇论文提出了diverse beam search算法,相当于对beam search算法的改进。经过实验证明,这种算法会使得输出多样性和准确性都大幅提高,而且DBS算法有很广阔的应用领域,包括image captioning、machine translation、conversation、visual question generation等。   

   

       在decode过程中,假设我们的单词表共有N个单词,

  • 2
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
"noisytwins: class-consistent and diverse lmage generation through stylegans" 是关于通过 StyleGANs 实现类别一致和多样化图像生成的研究。 StyleGAN 是一种生成对抗网络 (GAN) 的变种,用于生成逼真的图像。它通过学习图像的潜在空间表示来生成图像,其中每个点都对应一个唯一的图像。在这项研究中,noisytwins 提出了一种改进的 StyleGAN 模型,旨在生成类别一致且具有多样性的图像。 传统的 StyleGAN 模型通常只能生成与训练数据集类别相似的图像,而无法产生跨类别的多样性。对于一个类别,它通常只能生成该类别中的某一个具体样式的图像。然而,noisytwins 通过引入噪音向量,并通过控制这些向量的方式,将该模型扩展至能够在一个类别内生成多种样式的图像。 通过这种方式,noisytwins 的模型能够生成以同一类别为主题的图像,同时在样式上具有多样性。例如,如果我们以猫为类别,传统的 StyleGAN 模型只能生成某一种具体颜色和纹理的猫图像,而 noisytwins 的模型可以生成多种颜色和纹理的猫图像。 这项研究的意义在于扩展了现有的图像生成技术的应用范围。通过实现类别一致且具有多样性的图像生成,noisytwins 的模型可以在许多领域中有重要的应用,如计算机游戏开发、虚拟现实技术以及艺术创作等。 总之,"noisytwins: class-consistent and diverse lmage generation through stylegans" 是一篇关于利用改进的 StyleGANs 实现具有类别一致性和多样性的图像生成的研究,该研究扩展了现有的图像生成技术,并在多个领域中有广泛的应用潜力。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值