三维点云课程(六)——三维目标检测

目录

1.  图像目标检测

​ 1.1 评价检测好坏

 1.2 物体检测的方法

1.2.1 Two-Stage

 1.2.2 One-Stage

2. 点云目标检测 

2.1 VoxelNet

​2.2 PointPillars

2.3 Point-wise operation

2.3.1 PointRCNN

2.4 Vison Fusion

2.4.1 Frustum PointNet

​2.4.2 PointPainting


1.  图像目标检测

长方体表示:长宽高、中心点、朝向、类别

思路:先检测后分类

 1.1 评价检测好坏

 Precision:检测对的概率      Recall:检测到的概率    两者很难兼得

  • AP(Average Precision)  mAP(Mean over all categories)

  • NMS

每一个选择器后面都有一个NMS,选择一个最好的检测框

选择置信度最大的框,再计算其他框与该框的重叠范围IOU,如果大于一定阈值就舍去。

 1.2 物体检测的方法

1.2.1 Two-Stage

先定位后检测

  • RCNN :本质是一个聚类成框,再对框进行分类。需要对每个框进行分类很慢

  •  Fast RCNN

先对图像提取特征,再ROI Pooling缩放成统一大小,再经过MLP。分类神经网络是工作在Feature map上的。

ROI Pooling具体过程如下,不管框原先大小是什么,最后都缩放成7*7。

ROI Pooling 有精度损失,提出了ROI Align线性插值

  • Faster RCNN 

框是深度学习给的

  • Mask RCNN  实例分割

 1.2.2 One-Stage

 把背景看成一个类,每个地方出3个anchor box ,对每一个进行分类,计算位置。没有了先判断框内是否有物体。

2. 点云目标检测 

投影视角

三维网格

投影

2.1 VoxelNet

三维卷积pointnet++

有许多方格内是没有点的,不需要传入神经网络 ,加速方法如下

  • Data Augmentation

1、对整体点云旋转,但不能旋转太多

2、 对目标进行平移旋转,也不能太多 

2.2 PointPillars

空间一堆柱子,每一个柱子压缩成一个平面 

  • Focal Loss

解决类别不均衡问题,正常情况比较少的类别会被忽略,该方法将注意力转到小的类别上。

 

2.3 Point-wise operation

2.3.1 PointRCNN

  1. 得到每个点的feature vector
  2. 把前景背景分割,每一个前景做一个proposal
  3. 每一个box做ROI Pooling

所有操作都是以点的形式输入 

2.4 Vison Fusion

2.4.1 Frustum PointNet

将图像上的框投影到点云,视觉与LIDAR在时间空间上很难对齐。

2.4.2 PointPainting

  • 4
    点赞
  • 33
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

桦树无泪

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值