多模态
文章平均质量分 86
阿凡凡提
论文好难
展开
-
Adaptive Decision Fusion for Audio-Visual Speech Recognition(2008)
Adaptive Decision Fusion for Audio-Visual Speech Recognition(2008)视听语音识别中的自适应决策融合翻译 2022-05-17 04:15:00 · 651 阅读 · 0 评论 -
多模态汇总
文献名 发表年份/代码 数据集 网络 输入 输出 新思想 基于层次注意的视频情感识别多模态融合网络 2021/无 MHED 基于分层注意的多模态融合网络(HAMF):由CNN和Attention组成 视频帧 不同模态的情绪分数 ...原创 2022-05-01 17:57:37 · 311 阅读 · 0 评论 -
AGQA: A Benchmark for Compositional Spatio-Temporal Reasoning
AGQA:一个组合时空推理的基准翻译 2022-04-25 13:35:36 · 736 阅读 · 0 评论 -
Co-Grounding Networks with Semantic Attention for Referring Expression Comprehension in Videos
(用于视频中的目标物指代理解的)(具有语义注意的)联合接地网络翻译 2022-04-18 17:22:27 · 1697 阅读 · 1 评论 -
VLM: Task-agnostic Video-Language Model Pre-training for Video Understanding
VLM: Task-agnostic Video-Language Model Pre-training for Video UnderstandingVLM:用于视频理解的任务无关的视频语言模型预训练翻译 2022-04-16 09:00:00 · 1240 阅读 · 1 评论 -
Predicting Emotions in User-Generated Video
Predicting Emotions in User-Generated Video预测在用户生成的视频中的情绪翻译 2022-04-15 13:35:18 · 352 阅读 · 0 评论 -
Hierarchical Attention-Based Multimodal Fusion Network for Video Emotion Recognition
Hierarchical Attention-Based Multimodal Fusion Network for Video Emotion Recognition基于层次注意的视频情感识别多模态融合网络翻译 2022-04-15 13:28:36 · 1199 阅读 · 4 评论 -
Emotion Expression With Fact Transfer for Video Description基于事实传递的视频描述情感表达
Emotion Expression With Fact Transfer for Video Description基于事实传递的视频描述情感表达翻译 2022-04-15 13:19:48 · 681 阅读 · 0 评论