论文笔记： Review Networks for Caption Generation

最新推荐文章于 2024-06-20 00:19:56 发布

zdcs

最新推荐文章于 2024-06-20 00:19:56 发布

阅读量1.2k

点赞数

分类专栏：深度学习论文笔记自然语言处理文章标签：计算机视觉自然语言处理图像处理 VQA 人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zdcs/article/details/54892404

版权

自然语言处理同时被 3 个专栏收录

20 篇文章 1 订阅

订阅专栏

19 篇文章 1 订阅

订阅专栏

8 篇文章 0 订阅

订阅专栏

Review Networks for Caption Generation

ZhilinYang, YeYuan, YuexinWu, RuslanSalakhutdinov, WilliamW.Cohen School of Computer Science Carnegie Mellon University {zhiliny,yey1,yuexinw,rsalakhu,wcohen}@cs.cmu.edu

arXiv:1605.07912v4 [cs.LG] 27 Oct 2016

摘要：

本人提出了一种新的编码解码框架--'review network', 它是通用的，可以用于改进任何已有的编码解码模型

本文涉及两种模型， CNN encoder + RNN decoder 和 RNN encoder + RNN decoder

'review network'在编码器的隐藏状态中使用了若干带有注意力的review步骤，在每一次review后输出 'thought verctor', 该‘review network’被用于解码器中的注意力机制中的输入。

传统的编码解码框架可以视为reviwe network的特例。

两个变种：

AttentiveInput Reviewer: 主要针对图像

AttentiveOutputReviewer: 主要针对序列

注意力机制是解码器在生成过程中附加以编码器的隐藏状态为条件，而不仅仅是以单个context（最后一个encoder的）信息为条件

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
论文笔记： Review Networks for Caption Generation

Review Networks for Caption GenerationZhilinYang, YeYuan, YuexinWu, RuslanSalakhutdinov, WilliamW.Cohen School of Computer Science Carnegie Mellon University {zhiliny,yey1,yuexinw,rsalakhu,wcohen}@c
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。