论文介绍 -- Semantic Compositional Networks for Visual Captioning

最新推荐文章于 2022-09-04 11:19:46 发布

信道者

最新推荐文章于 2022-09-04 11:19:46 发布

阅读量717

点赞数

分类专栏：深度学习基础理论与技术实践人工智能文章标签： AI RNN Tag Semantics CVPR

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/chr1991/article/details/103767973

版权

本文介绍了2017年CVPR论文中的Semantic Compositional Networks (SCN)方法，该方法通过结合语义信息与RNN/LSTM，提升视觉描述的质量。SCN-RNN和SCN-LSTM模型利用多标签分类预测的图像语义概念，以动态调整RNN/LSTM的权重，降低参数量并优化性能。在MS-COCO、Flickr3k和Youtube2Text数据集上，实验结果表明SCN模型在多个评估指标上表现优异。

摘要由CSDN通过智能技术生成

Semantic Compositional Network for Visual Captioning是2017年发表在CVPR上的一篇论文。它的作者主要来自于杜克大学、清华大学和微软研究院（美国）。在这篇论文发表前，已经有几篇关于是使用语义信息来增强解码器生成语句质量的论文。这篇文章的创新之处在于它提出了一种使用语义信息来和循环神经网络参数进行的集成的方法。多标签分类网络对图像或者视频的分类结果被当作是视觉语义信息。

用于图像描述的普通RNN模型

有图像 $\bold{I}$ 和对应的描述 $\bold{X}$ 。我们首先提取特征向量 $v(\bold{I})$ 。这通常是预训练卷积神经网络的最后输出的特征图。为了表示的简洁，我们用表示 $v(\bold{I})$ 。长度为T的表述 $\bold{X}=\{x_1,x_2,x_3,...,x_T\}$ 。不同的描述语句有不同的。 x_k 被线性嵌入 n_x 维的低维空间得到 $w_t=\bold{W}x_t$ 。 $\bold{X}$ 的概率可以表示为 $p(\bold{X}|\bold{I})=\prod_{t=1}^Tp(x_t|x_0, ..., x_{t-1},x_t,v)$ 。

对于简单的循环神经网络，它的运作可以表示如下

最低0.47元/天解锁文章

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

信道者 CSDN认证博客专家 CSDN认证企业博客

码龄14年

248: 原创

3万+: 周排名

1万+: 总排名

52万+: 访问

: 等级

6380: 积分

361: 粉丝

330: 获赞

102: 评论

847: 收藏

私信

关注

热门文章

分类专栏

最新评论

1006. Tree Traversals - Hard Version (35)解题报告
爱编程的小陈同学: 错的题解 2 - - 1 - - 1
IEEE标准中32位、64位浮点数的取值范围
做而论道_CS: 浮点数，也没有什么可吹嘘的。它表示范围虽然较大，但是，它是有误差的。 32 位数，只能正确表示 7 位十进制数。要知道，许多应用场合，是不许有差错的。比如，财务领域，一分钱，也不能差！那么，金额 12345.6789 万元，用浮点数来计算，只能得出：12345.67 万元。因此，浮点数，只能蒙骗那些初学者。深入一点，就不能用它了。所以，稍稍了解一下，即可。
RNN、GRU和LSTM前向传播和反向传播的公式
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性；(2)增加除了各种控件外，文章正文的字数；(3)使用更多的站内链接。
如何修复Mfplat.dll无法找到或者缺失的错误
普通网友: 优质好文，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
2017年清华大学计算机科学与技术系考研小结
Findpsyche: 陈力就列，不能者止，如果你学到了文章中的内容就明白了，这是留给你计划的空间，如果没有自主抉择的能力你为什么要考取呢，如果写文章的人写的没有意义，怎么会有这么多收藏呢？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。