基于attention的video描述

最新推荐文章于 2022-05-20 11:17:09 发布

VIP文章迷川浩浩_ZJU

最新推荐文章于 2022-05-20 11:17:09 发布

阅读量5.4k

点赞数 2

分类专栏：视觉语义

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_21190081/article/details/53069237

版权

引言

这片博文内容主要基于2015年Y Li的论文Video Description Generation Incorporating Spatio-Temporal Features and a Soft-Attention Mechanism，本文将soft-attention机制引入到视频描述中。

视频特征提取采用一个用动作识别视频集训练的3-D CNN网络，之后利用soft-attention机制来加权确定输入到RNN/LSTM的特征向量，之后Decoder得到视频描述。整个模型简单概括为下图
这里写图片描述

模型

视频描述可以看做对于视频 $V$ 得到描述 $C=\left\{c^1,c^2,...,c^D \right\}$ ，有

p (c 1, c 2, . . ., c D | V) = p (c 1

最低0.47元/天解锁文章

迷川浩浩_ZJU

关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
基于attention的video描述

引言这片博文内容主要基于2015年Y Li的论文Video Description Generation Incorporating Spatio-Temporal Features and a Soft-Attention Mechanism，本文将soft-attention机制引入到视频描述中。视频特征提取采用一个用动作识别视频集训练的3-D CNN网络，之后利用soft-attention机
复制链接

扫一扫

专栏目录

迷川浩浩_ZJU CSDN认证博客专家 CSDN认证企业博客

码龄10年

27: 原创

17万+: 周排名

70万+: 总排名

28万+: 访问

: 等级

2600: 积分

755: 粉丝

201: 获赞

96: 评论

462: 收藏

私信

关注

热门文章

分类专栏

最新评论

极限学习机(ELM)
天`南: 真不错啊，写的，学到很多东西！要是有代码就更好了！
深度学习笔记（3）——CNN中一些特殊环节的反向传播
John5525: 我觉得，如果是任意指定一个位置的话，可能下次前向传播的时候，原先的最大值就不是最大值了，这样下去，应该会很难收敛
深度学习笔记（6）——CNN中的卷积block
Lucky_5917: 请问该问题解决了吗？我刚开始学习，也对block很疑惑
深度学习笔记（3）——CNN中一些特殊环节的反向传播
hughlee815: 请教博主，如果只是满足梯度之和不变的原则，那max_pool的时候为什么要记住max_id呢？bp的时候在任意一个位置指定为最大值不久行了吗？
【论文笔记】CycleGAN
qq_46511579: 训练时是分开训练吗？先训练a-b,再训练b-a吗？

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。