自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 VideoMix 论文笔记

VideoMix: Rethinking Data Augmentation for Video Classification VideoMix 论文链接: https://arxiv.org/abs/2012.03457代码地址:https://github.com/jayChung0302/videomix一、 Problem Statement对于视频识别任务中的数据增强策略缺乏广泛的研究。 作者试验图像域(static image-domain)数据增强策略对视频数据的有效性,特别是基于特

2021-11-23 16:02:21 2441

原创 Data Augmentation for Video Recognition 论文笔记

Learning Temporally Invariant and Localizable Features via Data Augmentation for Video Recognition ECCV 2020 论文链接: https://arxiv.org/abs/2008.05721一、 Problem Statement图像识别中数据增强的目的是通过学习空间不变特征来增强泛化能力。比如,geometric (cropping,flipping,rotating等),photometric

2021-11-20 14:34:17 2662

原创 A Comprehensive Study of Deep Video Action Recognition 论文笔记

A Comprehensive Study of Deep Video Action Recognition 论文链接: https://arxiv.org/abs/2012.06567一、 Problem Statement来自于李沐团队关于Action Recognition的综述。二、 Direction介绍了video action recognition的挑战:modeling long range temporal information in videoshigh comp

2021-11-18 13:36:49 1170

原创 K-Net 论文笔记

K-Net: Towards Unified Image Segmentation K-Net NeurIPS2021论文链接: https://arxiv.org/abs/2106.14855一、 Problem Statement目前的语义分割方法直接学习一系列的预定好类别的卷积核(semantic kernels),然后使用这些卷积核进行像素分类。然而,鉴于图像中实例数量的变化,将这一概念扩展到实例分割并非易事。在语义分割中,每个卷积核负责查找图像中相似类别的所有像素。而在实例分割中,每个像

2021-11-16 16:01:06 4841

原创 UPSNet 论文笔记

UPSNet: A Unified Panoptic Segmentation Network UPSNet CVPR2019 论文链接: https://arxiv.org/abs/1901.03784一、 Problem Statement目前很多网络都是利用实例分割和语义分割,进行后处理后得到全景分割的效果,因此作者提出一个统一的网络解决全景分割问题。Motivation: Since both tasks aim at understanding the visual scene at t

2021-11-12 09:37:22 565

原创 Cascade R-CNN: Delving into High Quality Object Detection 论文笔记

Cascade R-CNN: Delving into High Quality Object DetectionCascade R-CNN CVPR2018论文链接: https://arxiv.org/abs/1712.00726一、 Problem Statement在目标检测中,通常使用IoU的值来确定正负样本,如果使用低的IoU值,会产生noisy detection,如果使用高的IoU值,会有两个问题:在训练的时候会过拟合,因为正样本的数量指数级减少。推理的时候与训练的时候不匹配。

2021-11-08 15:23:03 164

原创 Benchmarking Robustness in Object Detection: Autonomous Driving when Winter is Coming 论文笔记

Benchmarking Robustness in Object Detection: Autonomous Driving when Winter is Coming 论文链接: https://arxiv.org/abs/1907.07484一、 Problem Statement几种类型的失真来增强训练数据,并不是实现对以前未知的失真的鲁棒性的解决方案。最近的研究表明,CNN对新的失真类型的泛化能力较差,尽管CNN接受了各种其他失真的训练。本文 关注不太极端但更常见的可感知图像失真问题,如

2021-11-03 09:41:09 231

原创 ThunderNet 论文笔记

ThunderNet: Towards Real-time Generic Object Detection ThunderNet 论文链接: https://arxiv.org/abs/1903.11752一、 Problem Statement作者设计一个在计算资源有限的情况下,能达到实时的检测器。目前的detectors分为两类:two-stage detectorsone-stage detectorstwo-stage检测器如Light-Head R-CNN,有一个缺点就是w

2021-11-02 14:06:21 210

原创 Panoptic Feature Pyramid Networks 论文笔记

Panoptic Feature Pyramid Networks CVPR 2019 论文链接: https://arxiv.org/abs/1901.02446一、 Problem Statement提出一个Panoptic Segmentation的baseline。目前的全景分割都是使用不同的网络进行实例分割和语义分割,并不够高效。二、 Direction使用一个统一的网络结构去实现两个任务,实例分割和语义分割,进一步实现全景分割。因此作者在基于FPN和Mask R-CNN,添加了一

2021-11-02 09:29:48 196

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除