公众号内容拓展学习笔记(2022.5.10)
📎 今日要点
-
CVPR 2022 | 涨点显著!AMD提出:动态Sparse R-CNN ⭐️⭐️
- Abstract: 涨点显著!AMD提出:动态Sparse R-CNN
- Paper: Dynamic Sparse R-CNN
- Tips:
Sparse R-CNN
是最近的一种强目标检测Baseline
,通过对稀疏的、可学习的proposal boxes
和proposal features
进行集合预测。在这项工作中提出了2个动态设计来改进Sparse R-CNN
。
-
CVPR2022|小样本行为识别最新进展STRM框架,时空关系建模仍是重中之重 ⭐️⭐️
- Abstract: 小样本行为识别最新进展STRM框架,时空关系建模仍是重中之重
- Paper: Spatio-temporal Relation Modeling for Few-shot Action Recognition
- Code: https://github.com/Anirudh257/strm
- Tips: 本文的出发点是解决小样本行为识别领域中的时空关系建模问题,提出了一种新颖的时空信息增强模块,分别从局部和全局的角度对视频中的对象特征和时空上下文进行捕捉。此外,作者还设计了一种查询类相似性分类器来增强网络对特定行为类的特征辨别能力。
-
CVPR 2022 | 从自注意力中学习语义Affinity用于端到端弱监督语义分割 ⭐️⭐️
- Abstract: 从自注意力中学习语义Affinity用于端到端弱监督语义分割
- Paper: Structured Pruning Learns Compact and Accurate Models
- Code: https://github.com/princeton-nlp/CoFiPruning
- Tips: 本文提出了一个Affinity from Attention(AFA)模块,从Transformer的注意力矩阵中学习高质量的语义Affinity信息,用于对初始伪标签进行改善。为了进一步补充伪标签的局部细节信息,同时保证端到端训练的效率,本文基于像素自适应卷积设计了一个高效的处理模块。
-
GitHub 20000+ Star,这个超轻量OCR系统效果再提升5% - 11%! ⭐️⭐️
- Abstract: 这个超轻量OCR系统效果再提升5% - 11%
- Code: https://github.com/PaddlePaddle/PaddleOCR
- Tips: 本次PaddleOCR最新发版,带来四大重磅升级,发布超轻量OCR系统PP-OCRv3;发布半自动标注工具PPOCRLabelv2;发布OCR产业落地工具集;发布业界首个交互式OCR开源电子书《动手学OCR》。
-
使用PyTorch复现ConvNext:从Resnet到ConvNext的完整步骤详解 ⭐️⭐️
- Abstract: 使用PyTorch复现ConvNext:从Resnet到ConvNext的完整步骤详解
- Tips: ConvNext论文提出了一种新的基于卷积的架构,不仅超越了基于 Transformer 的模型(如 Swin),而且可以随着数据量的增加而扩展!本文通过Pytorch对其进行复现。
-
视频目标跟踪从0到1,概念与方法 ⭐️⭐️
- Abstract: 视频目标跟踪从0到1,概念与方法
- Tips: 从目标跟踪的应用场景,底层模型,组件,类型和具体算法几个方面对目标跟踪做了全方面的介绍,非常好的入门文章。
📎 Others
![](https://i-blog.csdnimg.cn/blog_migrate/cabff6a71845363c40633a27193b6657.jpeg)