交通标志识别论文阅读(一)

Tsinghua-Tencent 100K

在数据集 Traffic Sign Recognition on Tsinghua-Tencent 100K 上,
在这里插入图片描述
只有一篇论文,其实这篇论文主要工作是数据集,在模型上,以faster rcnn为基础,添加了一个损失函数:
这是faster rcnn原来的损失函数,即类别损失,加上位置回归的损失。
在这里插入图片描述
本篇论文里的损失值:
在这里插入图片描述
中间那行是子类的损失,如果预测出类,那就继续预测子类,否则不预测。即中间那个pi只有1和0两个值。
再有一个three hold model,这其实就是在IoU那里设置了一个阈值,2018年的文章,现在看来设置阈值是很容易理解,但是2017年才出faster rcnn,这里提出阈值在当时也算先进的。
问题是在这个数据集上为什么只有这一个文章?没有人刷新他的准确率吗?

LISA Traffic Sign Dataset

在paper of code上,找不到该数据集的排行,在谷歌学术里搜索,大部分也是用faster rcnn做的,列举一下:
1.Traffic sign detection for us roads: Remaining challenges and a case for tracking这个是发布数据集的论文。
2.Automated Augmentation with Reinforcement Learning and GANs for Robust Identification of Traffic Signs using Front Camera Images Publisher: IEEE DOI: 10.1109/IEEECONF44664.2019.9049005
使用gan辅助检测,看下结构:
在这里插入图片描述
再看下这个Augmentation Method,用了两个GAN方法:
第一个是cycle gan:
在这里插入图片描述
第二个是bbgan:
在这里插入图片描述
至于这两个gan,网上教程一大堆。
3.A Cascaded R-CNN With Multiscale Attention and Imbalanced Samples for Traffic Sign DetectionPublisher: IEEE DOI: 10.1109/ACCESS.2020.2972338

在这里插入图片描述
通过网络看,这个FPN的设计,是不是和谷歌大脑的EfficientDet里的bi fpn(下图d)很相像?
如果出去蓝色箭头,黑线换成attention,是不是就一样了?嘿嘿。
在这里插入图片描述
到这里应该也就明白了,这个网络用在这个题目下,是解决多尺度问题,即小目标识别的问题。看原文:
在这里插入图片描述
当然也设置了阈值,在这里插入图片描述
如果看过Libra-Rcnn,看这个应该不陌生,这也是前面博客里一篇论文说的种类不平衡里的前景背景样本不平衡的问题。
最后两个是L1 Loss和多个注意力的公式:
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值