TPH-YOLOv5 论文笔记

最新推荐文章于 2024-05-21 15:04:47 发布

Tianchao龙虾

最新推荐文章于 2024-05-21 15:04:47 发布

阅读量4.9k

点赞数

分类专栏：网络Tricks 文章标签：深度学习神经网络计算机视觉

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wuchaohuo724/article/details/120819609

版权

网络Tricks 专栏收录该内容

15 篇文章 0 订阅

订阅专栏

TPH-YOLOv5: Improved YOLOv5 Based on Transformer Prediction Head for Object Detection on Drone-captured Scenarios

TPH-YOLOv5 2021 ICCV workshop

论文链接: https://arxiv.org/abs/2108.11539

一、 Problem Statement

利用和改进YOLOv5进行无人机目标识别。无人机目标识别通常有以下几个问题:

目标大小变化较大
运动模糊且目标密度大，目标覆盖重叠多
杂乱的地理元素，也就是目标的背景信息多

二、 Direction

基于YOLOv5，作者做了以下改进:

增加一个Prediction head。
使用Transformer encoder blocks替换一些convolutional blocks和CSP bottleneck blocks。
增加了CBAM block。
Multi-scale testing 和 self-trained classifier。

三、 Method

先来看一下整体的网络框架:

1. Prediction head for tiny objects

对于小目标检测，作者添加了一个Prediction head，如上图的head 1。这样总共四个Prediction head可以减轻目标大小变化较大的影响。所添加的那个Prediction head的输入是low-level和high-resolution的特征图，对小目标比较敏感。尽管添加了一个prediction head会带来速度影响，但是精度却提高较多。

2. Transformer encoder block

用transformer encoder block 替换一些convolutional block和CSP bottleneck blocks。作者认为transformer encoder block可以捕获全局信息和充足的背景信息，而且高密度遮挡目标上的表现也更好。

作者在prediction head上和backbone的末尾使用了transformer。因为网络的末端的特征图分辨率较小，可以降低计算和存储消耗。

3. CBAM

在无人机拍摄的图像上，大的覆盖区域总是包含令人困惑的地理元素。使用CBAM可以提取注意区域，帮助TPH-YOLOv5抵抗混乱的信息，并专注于有用的目标对象。

4. Multi-scale testing and self-trained classifier

作者发现TPH-YOLOv5有较好的定位能力，但是分类能力较弱。因此提出了一个额外的self-trained classifier。首先会通过裁剪ground-truth bounding boxes和resize到64x64来构建训练集。然后使用ResNet18，进行训练。

每个模块对应的提升效果如下:

四、 Conclusion

对于改进YOLOv5提供了tricks，可以借鉴参考。

Reference

关注

0
点赞
踩
16

收藏

觉得还不错? 一键收藏
0
评论
TPH-YOLOv5 论文笔记

TPH-YOLOv5: Improved YOLOv5 Based on Transformer Prediction Head for Object Detection on Drone-captured Scenarios TPH-YOLOv5 2021 ICCV workshop 论文链接: https://arxiv.org/abs/2108.11539一、 Problem Statement利用和改进YOLOv5进行无人机目标识别。无人机目标识别通常有以下几个问题:目标大小变化较大运
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。