测试时数据增广(TTA)与mmdetection3d中的实现

1. 测试时数据增广

  测试时数据增广(TTA)在测试时使用数据增广技术获取同一数据的多个“变体”,使用同一网络在这些“变体”以及原始数据上进行推断,最后整合所有结果作为该原始数据最终的预测结果。

TTA类似于集成学习,都是整合多个结果作为最终预测,但区别在于:TTA只使用一个模型,多个结果的来源是多个数据“变体”。

2. mmdetection3d中,点云数据的测试时数据增广

2.1 带数据增广的测试pipeline

  mmdetection3d中通常的测试pipeline为

MultiScaleFlipAug3D
数据增广
数据预处理
格式整理
数据读取
Collect3D
DefaultFormatBundle3D
PointsRangeFilter
RandomFlip3D
GlobalRotScaleTrans
LoadPointsFromMultiSweeps
LoadPointsFromFile

  数据集类的前期格式整理和数据读取,以及MultiScaleFlipAug3D中的数据预处理、格式整理的过程均与训练时一致(见此文)。

2.2 MultiScaleFlipAug3D

  相关的代码见mmdetection3d/mmdet3d/datasets/pipelines/test_time_aug.py

  • MultiScaleFlipAug3D:对每一个设定的缩放倍数和翻转方向,复制输入的数据信息字典并添加相应的项,输入到GlobalRotScaleTransRandomFlip3D中进行缩放和翻转。最终的输出为列表形式,其元素为各种增广处理后的数据字典(字典格式与训练时pipeline的输出一致)。
    • GlobalRotScaleTrans的设定为不进行旋转(旋转角度固定为0)和平移,但会读取数据字典中已有的参数(刚才添加的缩放倍数),进行全局缩放。
    • RandomFlip3D会读取数据字典中已有的参数(刚才添加的翻转方向),进行全局翻转。

当不进行测试时数据增广时,可在MultiScaleFlipAug3D中设置不翻转,缩放倍数为1。此时模型测试时会走向simple_test()函数,不进行结果的整合。

2.3 模型预测与结果整合

  当进行了测试时数据增广,则模型测试时会走向aug_test()函数,具体操作如下:

  • 首先,将各种增广数据作为一个batch,输入网络提取特征。
  • 然后调用aug_test_pts()函数,将各特征输入检测头得到边界框。
  • 调用merge_aug_bboxes_3d()函数,根据增广情况还原边界框(bbox3d_mapping_back())后,使用NMS进行结果整合。

注意:对于具体的处理方法,不同模型可能不同。

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

byzy

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值