【视觉对话】DAM: Deliberation, Abandon and Memory Networks for Generating Detailed

薄荷奶绿Yena

已于 2023-07-12 20:25:00 修改

阅读量50

点赞数

分类专栏：视觉对话文章标签：计算机视觉自然语言处理 transformer python

于 2023-07-12 20:13:36 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/nbwjszd/article/details/131689254

版权

原文标题：DAM: Deliberation, Abandon and Memory Networks for Generating Detailed and Non-repetitive Responses in Visual Dialogue
原文链接：https://arxiv.org/pdf/2007.03310
原文代码： https://github.com/JXZe/DAM
发布年度：2020年
发布期刊：IJCAI-20

简要描述

一种新颖的生成解码架构来生成高质量的响应。整合整体级别的全局语义信息和词级别的局部语义信息，来生成答案。全局语义负责保证生成回复的整体语义的连贯性和准确性，局部语义负责捕获当前生成的词的特有的语义信息。

背景

生成视觉对话系统的典型解决方案是基于编码器-解码器框架。编码器旨在通过嵌入捕获图像、问题和对话历史的语义，而解码器通过循环神经网络工作 (RNN)将这些嵌入解码为响应。由于生成难度，以往的大多数工作都专注于设计更全面的编码器结构，以利用输入中信息的不同方面。尽管这些方法取得了可喜的改进，但它们仍然有明显的局限性，例如生成不准确的细节和重复的单词或短语。

一方面，DAM 在响应级别合并了全局信息以保持语义一致性。另一方面，DAM 通过设计当前生成词引导的 Deliberation 单元来关注捕获单词级别的相关和独特细节。为了进一步减少重复，我们设计了 Abandon Unit 来为当前单词选择唯一信息。最后，记忆单元将派生的词级和响应级语义集成到记忆状态中进行词生成，有助于语义连贯性的统一和细节的丰富性。

最低0.47元/天解锁文章

薄荷奶绿Yena

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
【视觉对话】DAM: Deliberation, Abandon and Memory Networks for Generating Detailed

本文提出了一种新的由推敲单元、放弃单元和存储单元组成的生成解码器。新型解码器采用复合解码模式，对响应级和词级的信息进行建模，以防止生成的响应中重复。DAM是一种通用的解码体系结构，它可以与现有的视觉对话编码器相结合，以提高其性能。通过结合DAM与LF、MN和DualVD编码器的结合实验，我们提出的DAM可以有效地提高现有模型的生成性能，并在流行的基准数据集上获得新的最新结果。
复制链接

扫一扫

专栏目录

薄荷奶绿Yena CSDN认证博客专家 CSDN认证企业博客

码龄4年

22: 原创

17万+: 周排名

4万+: 总排名

1万+: 访问

: 等级

562: 积分

421: 粉丝

339: 获赞

9: 评论

393: 收藏

私信

关注

热门文章

分类专栏

最新评论

【多模态对抗攻击】VLATTACK: Multimodal Adversarial Attacks on Vision-Language Tasks via Pre-trained Models
CSDN-Ada助手: 恭喜用户发布了第15篇博客，“VLATTACK: Multimodal Adversarial Attacks on Vision-Language Tasks via Pre-trained Models”，内容看起来非常有深度和实用性。继续保持创作的热情和努力，不断分享您的研究成果和见解。同时，我建议您在未来的创作中可以尝试结合更多实际案例或者应用场景，让读者更容易理解和接受您的观点。期待您更多精彩的作品！
[物理对抗攻击]Adversarial Attack with Raindrops
CSDN-Ada助手: 恭喜您发布了第16篇博客！标题很吸引人，内容也十分有趣。对物理对抗攻击这一领域的探索让人眼前一亮。接下来，建议您可以尝试探讨更多不同类型的对抗攻击方法，或者深入研究其中的原理和应用场景。期待您的下一篇作品！加油！👏👏👏
【文本对抗攻击】Bridge the Gap Between CV and NLP!A Gradient-based Textual Adversarial Attack Framework
CSDN-Ada助手: 恭喜作者发布了第13篇博客！标题看起来非常专业和有趣，对文本对抗攻击的框架进行了很深入的探讨。希望作者能够继续保持创作的激情和热情，也期待能够看到更多关于CV和NLP之间桥梁的探索和应用。或许在下一篇博客中，可以结合实际案例或者应用场景，向读者展示如何将该框架应用到实际问题中，这样可以使读者更加深入地理解和学习。期待作者的下一篇精彩作品！
【多模态对抗】AdvCLIP: Downstream-agnostic Adversarial Examples in Multimodal Contrastive Learning
CSDN-Ada助手: 恭喜作者连续创作了第14篇博客，标题看起来非常专业和有深度。对于多模态对抗和下游无关对抗性例子在多模态对比学习中的研究，作者的探索和总结都非常有价值。不过，我个人认为在下一步的创作中，可以考虑加入更多实际案例或者应用场景的分析，以便让读者更好地理解和应用这些理论。希望作者能够继续保持创作激情，为我们带来更多有启发性的内容。
【鲁棒VQA】Digging out Discrimination Information from Generated Samples for Robust VQA
CSDN-Ada助手: 恭喜您撰写了这篇关于“鲁棒VQA”的博客！您对于从生成的样本中挖掘歧视信息的讨论非常深入，给读者带来了很多启发。我希望您能继续坚持创作，并且在下一篇博客中可以分享一些实际案例或者应用场景，以便更好地帮助读者理解和应用您的研究成果。期待您的下一篇作品！

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。