跨模态
页页读
这个作者很懒,什么都没留下…
展开
-
【论文翻译】Combining information from multi-stream features using deep neural network in speech recogniti
父条目:Combining information from multi-stream features using deep neural network in speech recognition基于深度神经网络的多流特征信息融合技术在语音识别中的应用摘要:本文的主题是在混合人工神经网络(ANN) -隐马尔可夫模型(HMM)框架下集成多流特征。研究了多流组合中对数滤波器组和...翻译 2020-01-07 15:48:11 · 420 阅读 · 0 评论 -
【论文翻译】Deep Visual-Semantic Hashing for Cross-Modal Retrieval
Deep Visual-Semantic Hashing for Cross-Modal Retrieval用于跨模态检索的深度视觉语义哈希摘要:由于哈希算法具有较高的存储和检索效率,在大规模多媒体检索中被广泛应用于近似近邻搜索。跨模态哈希能够有效地检索图像以响应文本查询,反之亦然,近年来受到越来越多的关注。现有的大多数跨模态哈希研究工作都没有捕捉到图像的空间依赖性和文本句子的时...翻译 2020-01-05 23:51:26 · 1197 阅读 · 0 评论 -
【论文翻译】Out of time: automated lip sync in the wild
pdf:https://ora.ox.ac.uk/objects/uuid:6bdd4768-6fbd-40ac-8efc-edca8a0325b3/download_file?file_format=pdf&safe_filename=Chung%2Band%2BZisserman%252C%2BOut%2Bof%2Btime%2B-%2Bautomated%2Blip%2Bsync...翻译 2020-01-03 17:22:37 · 2650 阅读 · 1 评论 -
【论文翻译】PERFECT MATCH: IMPROVED CROSS-MODAL EMBEDDINGS FOR AUDIO-VISUAL SYNCHRONISATION
PERFECT MATCH: IMPROVED CROSS-MODAL EMBEDDINGS FOR AUDIO-VISUAL SYNCHRONISATION超匹配:改进了用于音频-视频合成的跨地带调制摘要:本文提出了一种学习音频到视频同步的强大跨模态嵌入的新策略。在这里,我们将问题设置为跨模态检索,其中目标是找到给定短视频剪辑的最相关的音频片段。该方法建立在跨模态自我监督学...翻译 2020-01-01 21:39:13 · 1066 阅读 · 0 评论