Tsinghua-Tencent 100K
在数据集 Traffic Sign Recognition on Tsinghua-Tencent 100K 上,
只有一篇论文,其实这篇论文主要工作是数据集,在模型上,以faster rcnn为基础,添加了一个损失函数:
这是faster rcnn原来的损失函数,即类别损失,加上位置回归的损失。
本篇论文里的损失值:
中间那行是子类的损失,如果预测出类,那就继续预测子类,否则不预测。即中间那个pi只有1和0两个值。
再有一个three hold model,这其实就是在IoU那里设置了一个阈值,2018年的文章,现在看来设置阈值是很容易理解,但是2017年才出faster rcnn,这里提出阈值在当时也算先进的。
问题是在这个数据集上为什么只有这一个文章?没有人刷新他的准确率吗?
LISA Traffic Sign Dataset
在paper of code上,找不到该数据集的排行,在谷歌学术里搜索,大部分也是用faster rcnn做的,列举一下:
1.Traffic sign detection for us roads: Remaining challenges and a case for tracking这个是发布数据集的论文。
2.Automated Augmentation with Reinforcement Learning and GANs for Robust Identification of Traffic Signs using Front Camera Images Publisher: IEEE DOI: 10.1109/IEEECONF44664.2019.9049005
使用gan辅助检测,看下结构:
再看下这个Augmentation Method,用了两个GAN方法:
第一个是cycle gan:
第二个是bbgan:
至于这两个gan,网上教程一大堆。
3.A Cascaded R-CNN With Multiscale Attention and Imbalanced Samples for Traffic Sign DetectionPublisher: IEEE DOI: 10.1109/ACCESS.2020.2972338
通过网络看,这个FPN的设计,是不是和谷歌大脑的EfficientDet里的bi fpn(下图d)很相像?
如果出去蓝色箭头,黑线换成attention,是不是就一样了?嘿嘿。
到这里应该也就明白了,这个网络用在这个题目下,是解决多尺度问题,即小目标识别的问题。看原文:
当然也设置了阈值,
如果看过Libra-Rcnn,看这个应该不陌生,这也是前面博客里一篇论文说的种类不平衡里的前景背景样本不平衡的问题。
最后两个是L1 Loss和多个注意力的公式: