多媒体内容理解
关于多媒体技术的论文笔记和学习笔记
灵隐寺扫地僧
这个人还是不太懒,写了点东西~
展开
-
视频分类论文阅读笔记——Learning Spatiotemporal Features With 3D Convolutional Networks
论文:Learning Spatiotemporal Features With 3D Convolutional Networks作者:来源:ICCV2015代码:文章目录1.摘要1.摘要原创 2020-03-30 16:18:13 · 537 阅读 · 0 评论 -
VideoQA论文阅读笔记——TGIF-QA: Toward Spatio-Temporal Reasoning in Visual Question Answering
文章目录0 前言1.摘要引用文献总结知识0 前言论文题目作者codeCVPR2017_TGIF-QA: Toward Spatio-Temporal Reasoning in Visual Question Answering首尔国立大学github1.摘要本篇论文主要是讲图像问答(ImageQA)引入到视频领域(VideoQA),其有三个主要贡献:为Vi...原创 2020-02-25 15:58:04 · 1943 阅读 · 0 评论 -
VideoQA论文阅读笔记——Heterogeneous Memory Enhanced Multimodal Attention Model for Video Question Answering
文章目录0. 前言1. 摘要0. 前言论文题目作者单位Heterogeneous Memory Enhanced Multimodal Attention Model for VQA京东研究院1. 摘要这篇文章主要有三个点:提出一个 层次化存储器 从 外观特征 和 运动特征 两个方面来学习 全局的上下文信息;重新设计 问题存储器 来理解问题的复杂语义信息...原创 2020-02-25 15:57:31 · 983 阅读 · 0 评论 -
视频问答与推理(Video Question Answering and Reasoning)——论文调研
文章目录0 前言1. ACM MM2. CVPR3. ICCV4. AAAI更新时间——2019.12 首稿0 前言入坑 VQA 的第一步——前期论文调研。 调研近几年在各大会议上的论文发表情况,来了解一下这个方向的进展,主要包括 CVPR, ICCV, ECCV,ACM MM,,AAAI。之后准备总结一下常用的数据集以及经典的方法。1. ACM MMACM MM 是计算机科学...原创 2020-02-25 15:56:45 · 2019 阅读 · 0 评论