公众号内容拓展学习笔记(2021.4.26)
📎 今日要点
-
CVPR’21 | RMNet:又快又好!基于局部特征记忆网络的视频物体分割 ⭐️⭐️
- Abstract: 基于局部特征记忆的视频分割网络RMNet
- Paper: Efficient Regional Memory Network for Video Object Segmentation
- Code: https://github.com/hzxie/RMNet
- Tips: 本文主要是针对STM的全局匹配出现的误匹配问题,提出局部记忆网络来改善性能,可以和昨天阿里的LCM网络结合来看。
-
各类Transformer都得稍逊一筹,LV-ViT:探索多个用于提升ViT性能的高效Trick ⭐️⭐️
- Abstract: 探索多个用于提升ViT性能的高效Trick
- Paper: Token Labeling: Training a 85.4% Top-1 Accuracy Vision Transformer with 56M Parameters on ImageNet
- Code: https://github.com/zihangJiang/TokenLabeling
- Tips: 与更改网络结构不同,这篇文章主要是通过更多的Trick来提升模型的性能,对于做视觉比赛来说,这篇文章受益良多。
-
数据集 | 全新人脸微表情识别数据集——MMEW发布! ⭐️⭐️
- Abstract: 一个新的数据集——微-宏表情仓库(MMEW)
- Paper: Video-based Facial Micro-Expression Analysis: A Survey of Datasets, Features and Algorithms
- Dataset: http://www.dpailab.com/database.html
- Tips: 论文中也给出了现有最先进的微表情分析方法的性能,并指出未来研究的突出问题。
-
Transformer 的稳健性更好吗? ⭐️⭐️
- Abstract: 讨论Tranformer和CNN相比的稳健性(对抗训练)
- Paper1: Understanding Robustness of Transformers for Image Classification
- Paper2: On the Adversarial Robustness of Visual Transformers
- Tips:Transformer与CNN学习到的特征不同,而不一样的特征能取得相似的效果,可见Transformer确实是有别于CNN,且具有竞争力。
-
在目标检测中如何解决小目标的问题? ⭐️⭐️
- Abstract: 一些小目标物体检测的方法和思路
- Tips: 图像金字塔和多尺度滑动窗口检测 简单,粗暴和可靠的数据增强 特征融合FPN 合适的训练方法SNIP,SNIPER,SAN 更密集的Anchor采样和匹配策略S3FD, FaceBoxes
-
- Abstract: 热门的目标检测开源方案
- Tips: YOLOv4, DETR, EfficientDet, CenterNet2, DetectoRS
-
手把手教你用OpenCV做人脸口罩佩戴检测(附详细步骤+代码) ⭐️⭐️
- Abstract: 一个基于OpenCV的口罩佩戴检测系统项目
- Tips: 实现步骤:
- 使用OpenCV DNN网络检测人脸
- 通过HSV阈值提取肤色
- 通过肤色轮廓面积与人脸ROI面积比值判断是否佩戴口罩
-
腾讯/字节/华为/旷视 2022届实习面经—计算机视觉方向 ⭐️⭐️
- Abstract: 计算机视觉方向面经
- Tips: 没事就看看,看看就看看