视频分割
文章平均质量分 85
右边是我女神
笔记仓库
展开
-
Video Segmentation ETSN
文章目录AbstractIntroductionTechnical approachETSPNetAbstract关注两个问题:边界模糊与过度分割。ETSN的第一步是Efficient Temporal Series Pyramid Networks(ETSPNet),能够捕捉局部和全局的逐帧特征并且提供精确的边界预测。第二步是一种无监督的方法,称之为Local Burr Suppression(LBS),很大程度减少了过度分割的错误。Introduction第一个问题是边界的错误。这是因为标签原创 2022-02-05 19:08:54 · 2190 阅读 · 0 评论 -
Decoupled Sparial-Temporal Attention Network forSkeleton-Based Action Recognition
Abstract解决问题:以前的方法严重依赖于手工设计的遍历规则或图像拓扑结构来对关节之间的依赖关系建模。方法:提出了一种新的解耦时空注意网络(DSTA-Net),允许对关节之间的时空依赖关系建模,无需知道位置以及相互连接关系。具体来说,提出了三种注意力相关的模块:时空注意力解耦、解耦位置编码和空间全局正则化。在数据方面,引入了骨骼数据解耦技术,以强调空间/时间和不同运动尺度的特定特征。Introduction骨骼数据优点:在少量数据中包含高级语义信息;对动态环境有很强的适应性。骨骼数据的组成原创 2021-10-13 10:10:24 · 502 阅读 · 1 评论 -
Boundary-Aware Cascade Networks forTemporal Action Segmentation
文章目录专有名词存疑AbstractIntroductionBoundary-Aware Cascade Networks专有名词存疑temporally regularizing smooth predictions of action instancessemantic consistency insideborder-crossing discrepancyction boundariesAbstract解决问题:边界模糊、过度分割。解决方法:引入两个新组件; 提出了一种新的边原创 2021-09-20 15:33:01 · 194 阅读 · 0 评论 -
MS-TCN++
文章目录AbstractIntroductionTemporal Action SegmentationSingle- Stage TCNMulti-Satge TCNDual Dilated LayerMS-TCN++ExperimentsMS-TCN vs MS-TCN++Abstractmstcn在较低的层中,卷积给的感受野范围较小,因此本文提出了一种结合大小感受野的双重扩张层。IntroductionMS-TCN的一些选择是次优的:虽然MS-TCN的中高层的感受野非常大,但是下层的感受野原创 2021-09-18 15:57:06 · 629 阅读 · 0 评论 -
Coarse to Fine Multi-Resolution Temporal Convolutional Network
文章目录AbstractIntroductionMethodology模型结构Coarse-to-Fine Ensemble(C2F Ensemble)Abstract目标:解决过度分割问题。方法:时间编码器-解码器来解决序列碎片问题。特点:解码器遵循具有多个时间分辨率的隐式集合,并且从粗到细。其他贡献:采用多分辨率增强策略以强化训练;设计了支持架构的损失函数。成果:在三个数据集上取得了最好的效果。Introduction标准模型:MS-TCN两种改进思路:额外的训练;后处理原创 2021-07-17 20:50:08 · 230 阅读 · 0 评论 -
BCELoss&BCEWithLogitsLoss
BCELosstorch.nn.BCELoss(weight=None,size_average=True)weight:控制正样本权重;size_average:对Loss值取平均。loss(o,t)=−1n∑i(t[i]log(o[i])+(1−t[i])log(1−o[i])) loss(o,t)=-\frac{1}{n}\sum_i(t[i] log(o[i])+(1-t[i]) log(1-o[i])) loss(o,t)=−n1i∑(t[i]log(o[i])+(1−t[i])lo原创 2021-07-03 11:49:21 · 696 阅读 · 0 评论 -
Gtea(Learning to Recognize Objects in Egocentric Activities)
Abstract本文解决了从家庭活动的以自我为中心的视频中学习对象模型的问题,并使用了弱监督的方法。对每一个序列,我们只知道对象的名称,不知道外形或者位置。因此,我们的方法是一种具有鲁棒性的、无监督的、自下而上的分割方法。Introduction本文的动机是希望从弱标记的视频序列中自动学习丰富的人类活动和行为 模型。许多家庭性活动都涉及对象的操作,并且可以从对象使用的模式构建一个简单而有效的活动模型。通过以自我为中心或第一人称视频的形式来解决有限的训练数据问题。与第三人称视频相比,以自我为中原创 2021-07-02 11:35:55 · 498 阅读 · 0 评论 -
MS-TCN
文章目录AbstractIntroductionTemporal Action SegmentationSingle-Stage TCNMulti-Stage TCNExperimentsnumber of stagesMuti-Stage TCN vs. Deeper Single-Stage TCN传递参数的影响时间分辨率的影响number of stage微调特征的作用Abstract传统方法遵循两步流程:生成逐帧概率;提供给高级时间模型。最近方法:使用时间卷积直接对视频帧进行分类。本原创 2021-07-01 15:34:20 · 1358 阅读 · 1 评论 -
ASRF(通过检测动作边界来缓解过度分割错误)
文章目录AbstractIntroductionRelated Work视频呈现(特征提取网络)动作分割(分类网络)候选动作区域生成Our Proposed Method长程特征提取器ASBBRBAbstract动作段细化框架(ASFR);由一个长期特征提取器和两个分支组成:动作分割分支(ASB)和边界回归分支(BRB);长期特征提取器为两个分支提供共享特征;ASB用动作类对视频帧进行分类,BRB对动作边界概率进行回归;(Faster R-CNN即视感!)这两个模块相互交融,使得BRB预测的动作原创 2021-06-30 11:18:07 · 679 阅读 · 0 评论