自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(89)
  • 收藏
  • 关注

原创 深度目标检测的发展

目标检测的发展阶段:检测网络的出现和端到端;one-stage模型的出现及two-stage模型的优化;anchor-based模型的优化与改良anchor-free时代目标检测模型的种类:two-stage anchor-based detectorone-stage anchor-based detectoranchor-free detector(可细分为keypoint-based和center-based)目标检测的几个重要的出发点如何设计更好的特征提取网络?提取何种

2021-07-19 16:59:59 198

原创 深度学习管理工具

官方文档:在跟踪实验时,通过运行 mlflow ui 后在 http:// localhost:5000 中进行查看。目前没办法打开,也不确定是否将结果上传到mlflow的服务器中。mlflow 主要有四大功能:Tracking、Projects、Models、Model Registry(1) 跟踪实验以记录并比较实验参数和实验结果(2) 以可复用可复现的方式对代码进行打包,以便不同工程师去复现(3) 从各种ML库管理和部署模型到各种模型服务和推理平台(MLflow models)。

2023-06-25 08:43:25 791

原创 X-Formers

Transformer

2022-09-12 18:00:22 2784 1

原创 Group DETR

Group DETR

2022-09-03 19:47:57 1527 1

原创 华为性格测试

1、几个原则必须要遵守  (1)华为喜欢那种喜欢加班的人,所以必须要能吃苦耐劳不计较报酬  (2)华为喜欢中庸,不要表现自己的特性,有自己性格一定会被刷掉  (3)华为喜欢稳定的,稳定超过一切包括技术、包括是否能做事  (4)性格不能过激,比如那种会跳楼第一时间会被刷掉  (5)团队合作很重要,不要自己来往2、性格测试的主要测试点就是:  (1)地雷,比如你选择了不愿意加班,你自己觉得你英明神武等,直接淘汰  (2)自相矛盾,比如你刚开始选择你广泛听取别人意见,后面又选择你一个人做决定等(

2021-08-19 11:21:46 33155 2

原创 目标检测中的label assignment

目录1. 概述1. 概述与分类和分割不同,目标检测存在其特有的正负样本定义问题(label assignment),其显著影响着检测器的检测性能。label assignment根据是否需要适应多层结构,存在不同维度的定义:(1) 在FPN出现前,label assignment只需要考虑特征图的每个位置的正负性,我们称其为spatial dimension。(2) 在FPN出现后,label assignment除了需要考虑特征图的每个位置的正负性,还需要考虑某个尺寸的特征图应预测哪个尺寸范围

2021-07-19 16:56:34 570

原创 leetcode刷题小细节(Python3)

(1)判断某字符's'是否为数字:s.isdigit()(2)判断某字符's'是否为空格:s.isspace()或s == ' '(3)将某字符's'转换为数字:在转换前用s.isdigit()判断一下,再使用int(s)进行转换,否则会报错。if s.isdigit(): s = int(s)...

2021-06-06 20:47:39 171

原创 2021广东工业智造创新大赛-智能算法赛:瓷砖表面瑕疵质检

1. Dataset一个图多个目标,处理后一共5388张图,2125个瓷砖,好像部分瓷砖不是三张图片类别名 图像数量 边界框数量边异常 419 519 角异常 1779 1976 白色点瑕疵 1259 1945 浅色块瑕疵 643 981 深色点块瑕疵 2913 7986 光圈瑕疵

2021-01-11 11:36:26 1853 3

原创 目标检测中的NMS

1. NMS非极大值抑制(Non-Maximum suppression,NMS)是目标检测算法中一个必要的后处理过程,目的是消除同一个物体上的冗余预测框。NMS算法的主要思想是:先对网络预测出的所有边界框按照分数由高到低排序,然后选取分数最高的预测框作为target,分别计算target与其他剩下的预测框的重叠程度(用IOU来衡量),若重叠程度大于某一预先设定的阈值,则认为该预测框与target是同时负责预测同一个物体的,所以将该边界框删除,否则予以保留。接着在未被删除的预测框中选择分数最高的预测框

2020-11-07 16:03:52 4870 1

原创 目标检测中的多尺度特征

目录1. 图像金字塔(image pyramid)1.1 多尺度训练/测试(multi-scale training/testing)1.2 SNIP(Scale Normalization for Image Pyramids)2. 特征金字塔(feature pyramid)2.1 直接的多尺度特征预测2.2 多尺度特征融合+单尺度特征预测2.3 多尺度特征融合+多尺度特征预测目标检测中最具挑战性的问题就是目标的尺度变化问题(scale variance)。在目标检测中,物体的形状和尺寸大小不一,甚

2020-11-06 22:31:30 16051

原创 Cascade R-CNN

目录1. Motivation1.1 改变IoU阈值对检测器性能的影响1.2 Quality Mismatch1.3 Cascade R-CNN的提出2. Cascade R-CNN2.1 Cascade R-CNN和Iterative BBox比较2.2 Cascade R-CNN和Integral Loss比较3. 实验论文:Cascade R-CNN: Delving into High Quality Object Detection来源:CVPR 20181. Motivation1.1

2020-11-06 22:01:06 358

原创 EfficientDet

目录1. 贡献2. Motivation3. EfficientDet3.1 overview3.2 Cross-Scale Connections3.3 Weighted Feature Fusion3.4 Compound Scaling4. 实验论文:EfficientDet: Scalable and Efficient Object Detection来源:20191. 贡献提出了简单且高效的多尺度特征融合方法:双向特征金字塔网络(bi-directional feature pyra

2020-10-31 16:08:19 512

原创 DSSD

目录1. 概述2. DSSD2.1 overview2.2 Prediction module2.2 Deconvolution Module论文:DSSD : Deconvolutional Single Shot Detector来源:CVPR 20171. 概述DSSD是对SSD的改进,虽然SSD直接在多尺度特征上进行预测的做法提升了目标检测的准确度,但仍在存在一些缺点:SSD backbone(VGG16)的特征提取能力不够强;浅层特征的语义信息不够强,导致小目标的检测效果不好。既

2020-10-29 21:36:26 468

原创 M2Det

目录1. Motivation2. M2Det2.1 overview2.2 MLFPN2.2.1 Feature Fusion Module (FFM)2.2.2 Feature Fusion Module (FFM)2.2.3 Scale-wise Feature Aggregation Module (SFAM)3. 实验论文:M2Det: A Single-Shot Object Detector based on Multi-Level Feature Pyramid Network来源:20

2020-10-29 18:02:49 347

原创 STDN

目录1. Motivation1.1 直接的多尺度特征预测1.2 多尺度特征融合+单尺度特征预测论文:Scale-Transferrable Object Detection来源:CVPR 20181. Motivation现阶段(2018年),利用多尺度特征来解决目标检测中的尺度变化问题的算法大致可以分为3类直接的多尺度特征预测,如SSD,MSCNN,DSOD;多尺度特征融合+单尺度特征预测,如ION,HyperNet,TDM,YOLOv2多尺度特征融合+多尺度特征预测,如RON,FPN,

2020-10-29 15:22:16 626

原创 RON

目录1. 概述1.1 尺度变化性问题1.2 正负样本不平衡问题2. RON2.1 overview2.2 Reverse Connectiond多尺度特征融合方法2.3 anchor的放置2.4 Objectness Prior2.5 Detection and Bounding Box Regression2.6 Combining Objectness Prior with Detection3. 总结论文:RON: Reverse Connection with Objectness Prior

2020-10-28 21:02:43 407

原创 FreeAnchor

目录1. Motivation2. FreeAnchor2.1 Detector Training as Maximum Likelihood Estimation2.2 Detection Customized Likelihood论文:FreeAnchor: Learning to Match Anchors for Visual Object Detection来源:NIPS 20191. Motivation2. FreeAnchor2.1 Detector Training as Max

2020-10-28 15:00:17 326

原创 GA

目录1. Motivation2. Guided Anchoring2.1 overview2.2 anchor的2个设计准则2.3 中心点预测分支2.4 形状预测分支2.5 Feature Adaption论文:Region Proposal by Guided Anchoring来源:CVPR 20191. MotivationAnchor是物体检测中的一个重要概念,通常是人为设计的一组框,作为分类和边界框回归的基准框。无论是单阶段检测器还是两阶段检测器,都广泛地使用了anchor。例如,两

2020-10-26 12:17:42 330

原创 Generalized Focal Loss

目录1. Motivation1.1 存在的问题1.2 本文的解决方法2. Generalized Focal Loss(GFL)2.1 Quality Focal Loss (QFL)2.2 Distribution Focal Loss (DFL)2.3 Generalized Focal Loss (GFL)2.4 total loss3. 实验论文:Generalized Focal Loss: Learning Qualified and Distributed Bounding Boxes f

2020-10-24 22:07:03 848

原创 CoupleNet

目录1. Motivation2. CoupleNet2.1 整体结构2.2 Normalization2.3 Coupling strategy论文:CoupleNet: Coupling Global Structure with Local Parts for Object Detection来源:ICCV 20171. MotivationR-FCN使用位置敏感得分图( position-sensitive score maps)实现共享计算,提高了目标检测速度,但是,R-FCN的PSRo

2020-10-21 22:20:51 646

原创 MS-CNN

目录论文:A Unified Multi-scale Deep Convolutional Neural Network for Fast Object Detection来源:ECCV 2016MS-CNN是与SSD同年发表的一篇论文(稍晚于SSD)。相同点:都是采样多尺度特征预测,即直接把detection head接在同一骨干网络的不同特征层都采样用了anchor不同点:SSD是一阶段目标检测器,MS-CNN是两阶段目标检测器,MS-CNN是Faster R-CNN的mutil-

2020-10-21 22:20:40 883

原创 HyperNet

目录1. Motivation2. HyperNet2.1 流程图2.2 网络结构2.3 Hyper Feature extraction论文:HyperNet: Towards Accurate Region Proposal Generation and Joint Object Detection来源:CVPR 20161. MotivationFaster R-CNN的RPN对所设置的anchors(~2400个)进行二分类和粗回顾,消除了大量的背景类,但仍然给出了很多粗糙的候选区域,

2020-10-21 22:20:28 279

原创 Two-stage Anchor-based Object Detectors

目录1. 如何实现端到端的训练2. 如何通过共享计算提高目标检测速度3. 如何进一步提高目标检测准确率Two-stage Anchor-based Object Detectors通常具有比较高的检测准确度,其发展趋势主要有3方面:1. 如何实现端到端的训练R-CNN的端到端训练程度非常低:SS算法选择候选区域+backbone预训练+backbone微调+训练多个SVM二分类器+训练多个边界框回归器;Fast R-CNN实现除SS外的端到端训练:把分类器和回归器嵌入网络中,用多个全连接层来代替;

2020-10-21 22:13:13 218

原创 KL loss

目录1. Motivation2. KL loss2.1 符号定义2.2 高斯分布2.3 Bounding Box Regression with KL Loss2.4 Variance Voting3. 实验论文:Bounding box regression with uncertainty for accurate object detection来源:CVPR 20191. Motivation目标检测依赖于边界框回归来提高定位精度,而且通常只是直接预测出边界框偏移量,并未考虑边界框的不

2020-10-21 20:58:12 6521

原创 SNIP

这里写目录标题一级目录二级目录三级目录CNN-B实验:CNN-S实验CNN-B-FT一级目录二级目录三级目录CNN-B实验:实验目的:研究测试图像分辨率与训练图像分辨率之间的差异程度对模型分类准确度的影响。实验步骤:(高分辨率图像训练,低分辨率图像测试)使用ImageNet原始的224×224224\times224224×224训练图像(高分辨率训练图像)对ResNet-101进行训练。(作者直接使用了预训练好的ResNet-101)将ImageNet验证数据集中的224×224224\

2020-10-20 20:02:06 523

原创 RefineDet

目录1. Motivation2. RefineDet2.1 整体结构2.2 Transfer Connection Block(TCB)2.2 Anchor Refinement Module(ARM)3. 实验4. 优点论文:Single-Shot Refinement Neural Network for Object Detection来源:IEEE 20181. Motivation融合two-stage detector准确度高和one-stage detector速度快的优点,设计出

2020-10-20 20:01:49 148

原创 RetinaNet

论文: Focal Loss for Dense Object Detection.代码:https://github.com/facebookresearch/Detectron.来源:IEEE 20171. 概述本文提出了新的一阶段目标检测器:RetinaNet,RetinaNet 采用 ResNet-FPN 作为 backbone 来提取多尺度特征,后续分别采用分类子网络和边界框回归子网络来实现分类和回归。对于分类任务,作者设计了新的分类损失函数 Focal Loss 来训练分类子网路,目的是

2020-10-20 20:01:38 316

原创 YOLO系列

Object Detection之YOLOAbstract功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入目标检测的...

2020-10-20 20:01:18 549 1

原创 Light-Head R-CNN

目录1. Motivation2. Light-Head R-CNN2.1 整体结构2.2 关键点3. 实验论文:Light-Head R-CNN: In Defense of Two-Stage Object Detector时间:20171. Motivation对two-stage模型的的两个阶段进行命名:body:生成proposal的部分(backbone+RPN)head:对proposal进行分类和回归的部分为了提高准确率,two-stage模型将head设计得很复杂(hea

2020-10-20 20:01:04 430

原创 R-FCN

目录1. Motivation2. R-FCN论文:R-FCN: Object Detection via Region-based Fully Convolutional Networks来源:NIPS 20161. Motivation分类问题需要特征具有平移不变性(translation invariance),目标在图像中的任一位置均不能影响分类结果。CNN由于具有平移不变性,因此在分类问题中能达到比较好的分类准确度,一般来讲,网络越深,其具有的平移旋转不变性越强,这个性质对于保证分类模

2020-10-20 20:00:52 119

原创 Faster R-CNN

目录1. Motication2. Faster R-CNN2.1 网络结构2.2 RPN2.2.1 RPN是如何利用图像深度卷积特征来生成候选区域的?2.2.2 anchor的引入2.2.2 提取区域特征2.2.3 RPN head2.2.4 RPN是怎样进行训练的?论文:Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks来源:NIPS 20151. MoticationFast R-CNN仍

2020-10-20 20:00:39 149

原创 Fast R-CNN

目录1. Motivation2. Fast R-CNN2.1 整体流程2.2 RoI pooling层和SPP层的区别:2.3 多任务损失函数3. 实验4. 贡献论文:Fast R-CNN来源:ICCV 20151. Motivation2. Fast R-CNN2.1 整体流程产生候选区域:使用Selective Search找出输入图片中可能存在目标的侯选区域region proposalsCNN提取特征:使用一个CNN对整张图像进行特征提取区域映射:将候选区域大小映射到特征层上R

2020-10-20 19:59:23 139

原创 SPPnet

目录1. Motivation2. SPPnet2.1 SPP层的原理2.2 SPPnet的区域映射原理3. 总结论文: Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition.来源:ECCV 20141. MotivationR-CNN模型存在很多缺点和可改进的地方,其中的两个缺点如下:CNN网络后面接的FC层需要固定的输入大小,导致CNN也需要固定大小的输入,即要求候选区域在进入CNN前需要c

2020-10-20 19:59:09 806

原创 R-CNN

目录1. Motivation2. R-CNN2.1 整体流程2.2 Training2.2.1 候选区域提取2.2.2 训练CNN2.2.3 训练SVM2.2.4 训练边界框回归器3. 实验4. 优缺点论文:Rich feature hierarchies for accurate object detection and semantic segmentation来源:CVPR 20141. MotivationR-CNN(Regions with CNN features)第一次利用CNN来

2020-10-20 17:35:14 242

原创 SSD

SSD的整体架构借鉴了YOLOv1,即,直接在特征图上输出物体的类别和位置。与YOLOv1不同的是,SSD引入了Faster R-CNN中的anchor机制。SSD最大的贡献就是引入多尺度特征预测YOLOv1只在最后一层特征图上预测物体的类别和位置,SSD则在多个不同大小的特征图上同时预测物体的类别和位置;Faster R-CNN中的RPN只在最后一层特征图上设置anchor,SSD则在多个不同大小的特征图上同时设置anchorSSD的网络结构如下:以去除全连接层的VGG16作为backbo

2020-10-19 19:08:30 205

原创 IoU-Net

论文:Acquisition of Localization Confidence for Accurate Object Detection年份及出处:ECCV 2018出发点:1. 用预测框的分类得分作为NMS的排序依据是有缺点的用NMS移除重复预测框时,是按照预测框的分类得分(classification confidence)进行排序的,为什么类别得分可以作为评判预测框和GT框重合度好坏的依据呢?这样做会出现什么问题呢?the misalignment between classifi

2020-10-19 17:48:37 257

原创 TridentNet

论文标题:Scale-Aware Trident Networks for Object Detection年份及出处:ICCV 2019研究尺度变化问题首先研究感受野对目标检测性能的影响贡献:首次指出了不管是图像金字塔,还是SSD、FPN,都是利用不同大小的感受野来检测不同尺寸的物体,并通过实验研究了感受野对目标检测性能的影响。提出了新的目标检测网络TridentNet,该网络有多个分支(3个),每个分支生成尺寸特定的特征图,用于检测特定尺寸的物体。多个分支共享相同的网络结构和参数,但使用不

2020-10-19 17:39:36 310

原创 FPN

FPN论文: Feature Pyramid Networks for Object Detection.代码: https://github.com/unsky/FPN.年份及出处:2017生成特征的4种方法1. Single feature map这是最普通的特征生成方法,常见于 VGG 、ResNet等分类网络和 R-CNN、Fast R-CNN、Faster R-CNN等目标检测网络中。该方法使用网络的最后一层特征进行预测,其优点是计算简单、对计算机的计算能力和内存大小的要求较小。但因

2020-10-19 17:27:23 392

原创 Anchor-free Object Detectors

2015DenseBox: Unifying Landmark Localization with End to End Object Detection2016You Only Look Once: Unified, Real-Time Object Detection [CVPR]UnitBox: An Advanced Object Detection Network [acm multimedia]2018CornerNet: Detecting Objects as

2020-10-19 17:17:23 360

原创 BorderDet

目录1. 摘要2. Motivation2. 整体框架这是ECCV2020的一篇Oral论文,由旷世研究院提出。论文:BorderDet: Border Feature for Dense Object Detection代码: https://github.com/MegviiBaseDetection/BorderDet论文作者马宇宸的知乎:ECCV2020 Oral |BorderDet用边界特征做检测​1. 摘要在目标检测领域,检测器一般会通过滑窗的方式来预测图像网格上的物体,并且还会

2020-10-19 17:15:56 307

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除