小样本学习
文章平均质量分 88
秃头嘤嘤魔
这个作者很懒,什么都没留下…
展开
-
Meta-Baseline Exploring Simple Meta-Learning for Few-Shot Learning
Meta-Baseline: Exploring Simple Meta-Learning for Few-Shot Learning介绍现在大多数方法使用元学习meta-learning解决小样本任务,即将整个训练集划分为三种类别不相交的训练、验证和测试集。网络训练时以task为单位,每个task视为一个N-way K-shot任务,由Support Set包括N×KN\times KN×K样本和Query SetN×QN\times QN×Q样本组成。根据支持集样本将N×QN\times QN×Q样原创 2021-12-06 14:14:00 · 1611 阅读 · 0 评论 -
Temporal Distinct Representation Learning for Action Recognition
背景将2D CNN用于视频相关任务时存在两个问题:1、不同帧使用相同的卷积核提取特征,会导致大量冗余数据。2、大量数据冗余主要表现在spatial semantics extraction(空间语义信息提取)上。对此作者提出了Progressive Enhancement Module(PEM)模块,类似SE-Net设计,PEM对特征进行注意力加权,对具有可鉴别信息的通道进行加强,同时压缩连续帧的通道从而减少冗余特征。此外,作者还在时域信息建模后,设计了一个Temporal Diversity lo原创 2021-11-18 14:31:06 · 224 阅读 · 0 评论 -
Dense Dilated Network for Few Shot Action Recognition
Motivation数据稀缺问题是新出现的行动类别的一个常见问题,这阻碍了神经网络学习辨别特征。同一类别中的动作具有多种背景,这需要足够数量的带注释的视频数据来训练深度神经网络。因此作者想能不能用很少的例子找到学习新动作类别的方法?方法作者采用了图像识别任务中一个新颖的DenseNet,采用密集连接来充分利用整个视频的时空信息。将一个视频分为n个片段,使用TSN分别提取空间信息和时间信息,然后使用具有密集连接的块提取特征,最后得到每个片段的预测分数,融合分数得到视频的预测结果。Dense Dila原创 2021-04-21 10:32:52 · 636 阅读 · 3 评论 -
Few-Shot Action Recognition with Compromised Metric via Optimal Transport
这篇文章基于最优传输OT来设计distance函数paper: https://arxiv.org/pdf/2104.03737.pdfMotivation在小样本行为识别方法中,作者分析大致可以分为两种。一种是基于aggregation,即将视频分为若干segment,提取每个segment特征,采用average pooling等方式对segment特征进行聚合得到一个视频级特征,设计一个距离函数,计算unseen类特征到seen类特征距离,得到预测标签;另一种是基于matching的方法,即提原创 2021-04-12 15:10:01 · 655 阅读 · 7 评论 -
Temporal-Relational CrossTransformers for Few-Shot Action Recognition
这篇文章用到了transformer来对视频帧进行时序信息探索,网络结构是基于原型网络进行改进的,代码已开源。paper: https://arxiv.org/abs/2101.06184code: https://github.com/tobyperrett/trxMotivation在该文章之前,小样本学习方法都是将query视频和support集视频中最好的 视频相比,或是和所有视频匹配,最后取平均。该方法带来的问题是,同一个动作不同的视频有着不同的长度和速度,因此此种匹配方式不太符合视频的原创 2021-04-01 11:04:41 · 3329 阅读 · 6 评论 -
SEMI-SUPERVISED FEW-SHOT ATOMIC ACTION RECOGNITION
提示:这里可以添加要学的内容例如:1、 搭建 Java 开发环境2、 掌握 Java 基本语法3、 掌握条件语句4、 掌握循环语句Motivation提示:这里统计学习计划的总量例如:1、 技术笔记 2 遍2、CSDN 技术博客 3 篇3、 学习的 vlog 视频 1 个...原创 2021-03-31 15:05:05 · 389 阅读 · 8 评论 -
CLTA: Contents and Length-based Temporal Attention for Few-shot Action
Motivation使用3D卷积或者3D+LSTM会导致过拟合,因为用了很少的数据去训练一个复杂的模型。现在的小样本方法大多是基于比较视频描述子的,但是很多方法只注重了空间信息而忽略了时间信息。作者介绍了三种用于小样本行为识别的方法,第一种通过帧特征的点乘计算帧之间的自注意力从而赋予时间权重,但是没有考虑连续帧,会错失关键帧;第二种使用temporal filter为不同帧赋予不同时间权重,但是从seen action用于unseen action可能会丢失时间信息;第三种之间比较帧之间的相似性,但是会原创 2021-03-31 10:04:51 · 221 阅读 · 4 评论 -
Few-shot Action Recognition with Prototype-centered Attentive Learning阅读笔记
遇到的问题相同类间存在交叉,还会存在一些外围的孤立样本,这种数据分布对于小样本识别而言会产生很大的影响。因此作者提出采用transformer中的自注意力来减轻这些限制。同时作者认为,以query样本为中心的匹配机制缺乏数据有效性,没有充分利用有限数据之间的分布关系,因此提出了一个以原型为中心的匹配作为补充。方法作者提出了一个原型为中心的注意学习模型,解决了类间重叠和外围孤立样本的问题。1、 提出了HAL混合注意力学习,在支持集上应用自监督,在从查询集到支持集上应用交叉监督,从而降低类间差别2原创 2021-03-03 10:38:55 · 785 阅读 · 6 评论 -
基于度量metric学习的few-shot learning
本文主要看了四种网络,分别为孪生网络、匹配网络、原型网络和关系网络,对这四个网络进行简要的介绍,详细可看原文。Siamese Neural Networks for One-shot Image RecognitionMatching Networks for One Shot LearningPrototypical Networks for Few-shot LearningLearning to Compare: Relation Network for Few-Shot Learning原创 2021-03-03 10:17:04 · 794 阅读 · 1 评论 -
Few-Shot Video Classification via Temporal Alignment
这篇文章是2019年的关于小样本在行为识别领域的应用,其主要是通过对齐两个视频的帧,用最小路径的代价衡量两个视频的相似度从而实现视频分类的。原创 2020-12-06 11:16:40 · 1163 阅读 · 0 评论