交通标志识别论文阅读（一）

最新推荐文章于 2023-04-17 14:56:06 发布

渐消散

最新推荐文章于 2023-04-17 14:56:06 发布

阅读量1.7k

点赞数 1

分类专栏：论文阅读文章标签：深度学习人工智能

本文链接：https://blog.csdn.net/weixin_43257313/article/details/107372895

版权

论文阅读专栏收录该内容

12 篇文章 0 订阅

订阅专栏

交通标志数据集

Tsinghua-Tencent 100K
LISA Traffic Sign Dataset

Tsinghua-Tencent 100K

在数据集 Traffic Sign Recognition on Tsinghua-Tencent 100K 上，
在这里插入图片描述
只有一篇论文，其实这篇论文主要工作是数据集，在模型上，以faster rcnn为基础，添加了一个损失函数：
这是faster rcnn原来的损失函数，即类别损失，加上位置回归的损失。

本篇论文里的损失值：

中间那行是子类的损失，如果预测出类，那就继续预测子类，否则不预测。即中间那个pi只有1和0两个值。
再有一个three hold model，这其实就是在IoU那里设置了一个阈值，2018年的文章，现在看来设置阈值是很容易理解，但是2017年才出faster rcnn，这里提出阈值在当时也算先进的。
问题是在这个数据集上为什么只有这一个文章？没有人刷新他的准确率吗？

LISA Traffic Sign Dataset

在paper of code上，找不到该数据集的排行，在谷歌学术里搜索，大部分也是用faster rcnn做的，列举一下：
1.Traffic sign detection for us roads: Remaining challenges and a case for tracking这个是发布数据集的论文。
2.Automated Augmentation with Reinforcement Learning and GANs for Robust Identification of Traffic Signs using Front Camera Images Publisher: IEEE DOI: 10.1109/IEEECONF44664.2019.9049005
使用gan辅助检测，看下结构：
在这里插入图片描述
再看下这个Augmentation Method，用了两个GAN方法：
第一个是cycle gan：

第二个是bbgan：

至于这两个gan，网上教程一大堆。
3.A Cascaded R-CNN With Multiscale Attention and Imbalanced Samples for Traffic Sign DetectionPublisher: IEEE DOI: 10.1109/ACCESS.2020.2972338

在这里插入图片描述
通过网络看，这个FPN的设计，是不是和谷歌大脑的EfﬁcientDet里的bi fpn（下图d）很相像?
如果出去蓝色箭头，黑线换成attention，是不是就一样了？嘿嘿。

到这里应该也就明白了，这个网络用在这个题目下，是解决多尺度问题，即小目标识别的问题。看原文：
在这里插入图片描述
当然也设置了阈值，
如果看过Libra-Rcnn,看这个应该不陌生，这也是前面博客里一篇论文说的种类不平衡里的前景背景样本不平衡的问题。
最后两个是L1 Loss和多个注意力的公式：