论文翻译
lowkeybin
这个作者很懒,什么都没留下…
展开
-
SV-RCNet: Workflow Recognition from Surgical Videos using Recurrent Convolutional Network
本文为原作者为香港中文大学Yueming Jin等人原文地址译文:lowkeybin#摘要我们提出了一种基于新型循环卷积神经网络(SV-RCNet)的外科手术视频分析,专门用于在线外科手术视频的工作流程的自动识别,这是开发情感感知的计算机辅助干预系统的一个关键组成部分。与以前分别利用视觉信息的时间信息的方法不同,SV-RCNet为了充分利用从视频中学习到的视觉和时间特征的互补信息,提出了一种...原创 2019-04-15 18:48:34 · 799 阅读 · 1 评论 -
Temporal Relational Reasoning in Videos(视频中的时序推理)
本文的原作者为MIT的Bolei Zhou等人原文地址译文:lowkeybin#摘要时序推理是智能物种的基本能力,即随着时间的推移将目标或实体有意义的转换联系起来的能力。在本文中,我们将介绍一种有效且能解释的网络模型–时序网络(the Temporal Relation Network(TRN)),该模型能学习并推断视频中多尺度上帧的时序依赖问题。我们在最近三个基本需要依赖时序推理的数据集S...原创 2019-04-15 18:49:39 · 1206 阅读 · 0 评论 -
Temporal Segment Networks: Towards Good Practices for Deep Action Recognition(时间段网络:使用深度行为识别的良好实现)
本文的原作者为Limin Wang等人原文地址#摘要深度卷积网络在静止图像中的视觉识别方面取得了巨大成功。然而,对于视频中的动作识别,优于传统方法的优势并不明显。本文旨在探索为视频中的动作识别设计有效的ConvNet架构的原则,并在有限的训练样本下学习这些模型。我们的第一个贡献是时间片段网络(TSN),一种基于视频的动作识别的新颖框架。这是基于远程时间结构建模的思想。它结合了稀疏时间采样策略和...原创 2019-04-15 18:50:43 · 1645 阅读 · 0 评论 -
Rethinking the Faster R-CNN Architecture for Temporal Action Localization原文翻译
原文作者:Yu-Wei Chao等人原文地址译文:lowkeybin摘要我们提出了一种改进的方法TAL-Net用于视频中的时序动作定位,这是一种灵感来源于Fast R-CNN目标检测框架的网络。TAL-Net解决了现存方法的三个关键性缺点:(1)我们使用一种多尺度框架改进了感受野的校准,这使得我们的方法能够适应视频动作长度的极端变化。(2)我们通过适当扩大感受野更好的利用了动作的时序上下文...原创 2019-06-28 17:44:44 · 691 阅读 · 0 评论