自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 收藏
  • 关注

原创 【3D 目标检测】Not All Points Are Equal Learning Highly Efficient Point-based Detectors for 3D LiDAR Point

Not All Points Are Equal Learning Highly Efficient Point-based Detectors for 3D LiDAR Point Cloud一 核心思想为了降低内存和计算成本,现有的基于point的pipeline通常采用随机采样或FPS采样来逐步下采样输入点云,尽管并非所有的点对目标检测任务都同等重要。特别是,前景点在本质上比背景点对目标探测器更重要。基于此,本文提出了一种高效的single-stagepoint-based 3Ddetec..

2022-05-17 21:02:13 1057

原创 【3D 目标检测】Structure Aware Single-stage 3D Object Detection from Point Cloud

一 核心思想本文的核心思想是使用一个辅助的分支帮助主干网络进行训练;除此之外,本文还提出PSWarp的架构,将预测的BBox和Cls进行联立,具体的Motivation见下述。不过本人认为该辅助分支与PVRCNN网络架构中的VoxelSetAbstractionModule非常相似,都是将Voxel的features映射到samplepoint中,然后concatenate一下得出samplepoint的特征。将samplepoint的特征输入到另一个detector中,得到fore...

2021-12-19 21:33:32 577

原创 【3D 目标检测】M3DETR

M3DETR:Multi representation, Multi scale, Mutual relation 3D Object Detection with Transformers一 核心思路本文的主要思想在于将point-feature、voxel-feature、bird-eyeview通过一系列的transformer得到RoI-Align需要用到的refine特征。是anchor-based的方法。transformer利用multi-headattention来减少不...

2021-11-22 21:49:16 2654 2

原创 【3D 目标检测】Voxel Transformer for 3D Object Detection

一 核心思想本文主要是在3Dbackbone上用到了改进的transformer方法,以便更好的提取特征。也就是在sparsevoxelmodule和submanifoldvoxelmodule的基础上使用transformer进行特征的提取。提出两种attention的机制,分别为LocalAttention和 DilatedAttention。之后通过Fast VoxelQuery的方法加速queryingprocess的进程(这里之后会详细叙述。)。VoTr包含一系列的...

2021-10-23 22:27:14 2406 5

原创 【2D 目标检测】CornerNet: Detecting Objects as Paired Keypoints

一 核心思想本篇文章提出非常新颖的检测方法,不同于以往的anchor-based的方法,CornerNet是基于一对关键点进行物体的检测的(文中讲的为2D检测方法,因此检测的为左上角和右下角两个点。)。除此之外,本文还提出cornerpooling层,以便更好提取特征。具体算法步骤如下图所示:二 核心步骤如上图所示,本文的创新点是提出使用一对关键点(也就是相对应的top-leftheatmap和bottom-rightheatmap)来检测出boundingbox,而不是...

2021-10-10 21:20:07 793

原创 【3D 目标检测】TANet: Robust 3D Object Detection from Point Clouds with Triple Attention

一 核心思想本文提出的TANet方法,在pedestrain上表现很好。主要应用tripleattention方法,对目标的特征进行权重的调整。网络主要分为两个框架,一个是TripleAttention框架和Coarse-to-FineRegression框架。1、Triple Attention。结合channel-wise注意力、point-wise注意力和voxel-wise注意力来增强目标的关键信息,并抑制不稳定的点。其中channel-wise注意力用于判断每个voxel中哪些cha...

2021-10-10 21:01:38 1426

原创 【3D 目标检测】AFDet V2:1st Place Solutions to the Real-time 3D Detection and the Most Effificient Model

一 核心思路AFDetV2承接AFDet的一大续作,是Waymo2021的冠军。与V1版本不同的地方主要在于:精简的3Dfeatureextractor、一种improvedRPN、新增的两个detecthead(分别为IoU-awareconfidencescoreprediction和Keypointsauxiliarysupervision)。具体算法流程见下图所示:所有的步骤分为:pointCloudVoxelization、3DFeatureExtractor...

2021-10-10 20:49:33 1290 2

原创 【3D 目标检测】AFDet: Anchor Free One Stage 3D Object Detection

一 核心思路本文也是在Waymo上的2020年排名第一的方法,是One-stage的3D detection的方法。主要是将point cloud映射到voxel的网格中,文章用到的映射方法为PointPillar,然后通过5个head分别预测物体不同的特征,最后进行回归预测得出最终的预测结果。总体思路见下图所示:二 核心步骤作者将本文的算法框架分为三个方面:point cloud encoder、backbone and necks和anchor free detector。2.1 P

2021-09-29 16:25:33 951

原创 【3D 目标检测】PV-RCNN++

一 核心思路在开始本博客的阅读时,需先对PVRCNN进行大体的了解,也就见我的另一篇博客【3D 目标检测】PVRCNN详解(个人阅读心得并总结其他人的结论得出的文章)_qq_36380978的博客-CSDN博客这篇文章是在PVRCNN的基础上进行改进的。主要是为了提升效率,降低运算成本。主要的创新点在于提出了sectorized proposal-centric key point sampling strategy和VectorPool。第一个创新是为代替在PVRCNN上的Keypoints

2021-09-17 16:04:25 1670

原创 【3D 目标检测】3DSSD: Point-based 3D Single Stage Object Detector

一 核心思路本篇通过观察point-based目标检测方法中,在PointNet++的上采样层(FP层)和refinement Module上面耗费了大量时间,因此作者借此提出了one-stage的3D目标检测网络结构。创新点是提出了F-FPS的采样算法、Candidate Generation Layer、anchor-free regression head以及3D center-ness assignment strategy。F-FPS算法主要是为了增加采样的质量,采样出更多前景点;Candia

2021-09-14 20:47:33 1121

原创 【3D 目标检测】STD: Sparse-to-Dense 3D Object Detector for Point Cloud 详解

一 核心思想这篇文章最主要的想法是更好的结合point-based和voxel-based方法,是一个2-stage的检测方法,与Faster RCNN类似,第一阶段进行proposal的选择,第二阶段对第一阶段的proposal进行refine处理。除此之外,本文还提出Spherical anchor、PointsPool Layer的创新方法,不过个人认为只是对Pointrcnn与voxel的一种整合办法,pointrcnn负责stage-1,VFE作为stage-2的特征提取。下图为算法的

2021-09-05 21:10:18 1116

原创 【3D 目标检测】PVRCNN详解(个人阅读心得并总结其他人的结论得出的文章)

第一篇3d检测博客,尽量做的详细。一 核心思路文章称该方法把point-based和voxel-based两种方法的优势结合起来,提高了3D目标检测的表现。基于体素的操作可以高效的编码多尺度特征表示并生成高质量3D提案框,基于point操作有可变的感受野故可以保留更精确的位置信息。voxel-based(grid)优缺点:高效、但信息损失降低定位细粒度的精度(fine grained localization accuracy)point-based优缺点:计算成本高、但可以得到更大的感受野

2021-08-26 21:08:40 7779

原创 np.T 与 np.reshape的区别

np.T 与 np.reshape的区别np.T可以将(4,5)转换成(5,4)其中转换的方法与线性代数中的转置对应// An highlighted blockc = np.random.randint(1,10,(4,5))carray([[2, 4, 9, 6, 7], [9, 3, 3, 9, 6], [1, 3, 5, 1, 1], [4, 6, 1, 8, 8]])c.Tarray([[2, 9, 1, 4], [4, 3,

2020-06-14 23:38:42 4231

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除