测试时数据增广（TTA）与mmdetection3d中的实现

byzy

已于 2023-10-13 22:02:23 修改

阅读量593

点赞数 1

分类专栏： MMDetection3D学习文章标签：目标检测自动驾驶深度学习

于 2023-10-13 14:43:33 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45657478/article/details/133718393

版权

MMDetection3D学习专栏收录该内容

14 篇文章 24 订阅

订阅专栏

1. 测试时数据增广

测试时数据增广（TTA）在测试时使用数据增广技术获取同一数据的多个“变体”，使用同一网络在这些“变体”以及原始数据上进行推断，最后整合所有结果作为该原始数据最终的预测结果。

TTA类似于集成学习，都是整合多个结果作为最终预测，但区别在于：TTA只使用一个模型，多个结果的来源是多个数据“变体”。

2. mmdetection3d中，点云数据的测试时数据增广

2.1 带数据增广的测试pipeline

mmdetection3d中通常的测试pipeline为

数据集类的前期格式整理和数据读取，以及MultiScaleFlipAug3D中的数据预处理、格式整理的过程均与训练时一致（见此文）。

2.2 `MultiScaleFlipAug3D`

相关的代码见mmdetection3d/mmdet3d/datasets/pipelines/test_time_aug.py。

MultiScaleFlipAug3D：对每一个设定的缩放倍数和翻转方向，复制输入的数据信息字典并添加相应的项，输入到GlobalRotScaleTrans与RandomFlip3D中进行缩放和翻转。最终的输出为列表形式，其元素为各种增广处理后的数据字典（字典格式与训练时pipeline的输出一致）。
- GlobalRotScaleTrans的设定为不进行旋转（旋转角度固定为0）和平移，但会读取数据字典中已有的参数（刚才添加的缩放倍数），进行全局缩放。
- RandomFlip3D会读取数据字典中已有的参数（刚才添加的翻转方向），进行全局翻转。

当不进行测试时数据增广时，可在MultiScaleFlipAug3D中设置不翻转，缩放倍数为1。此时模型测试时会走向simple_test()函数，不进行结果的整合。

2.3 模型预测与结果整合

当进行了测试时数据增广，则模型测试时会走向aug_test()函数，具体操作如下：

首先，将各种增广数据作为一个batch，输入网络提取特征。
然后调用aug_test_pts()函数，将各特征输入检测头得到边界框。
调用merge_aug_bboxes_3d()函数，根据增广情况还原边界框（bbox3d_mapping_back()）后，使用NMS进行结果整合。

注意：对于具体的处理方法，不同模型可能不同。

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
测试时数据增广（TTA）与mmdetection3d中的实现

测试时数据增广（TTA）与mmdetection3d中的实现
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

byzy 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。