基于3D卷积的图像序列特征提取与自注意力的车牌识别方法

本文提出了一种基于自注意力的免矫正车牌识别方法T-LPR,结合3D卷积对图像序列进行特征提取。通过序列化图像切片并用3D卷积获取嵌入向量,然后利用Transformer编码器学习嵌入向量间的关系,最后通过分类器完成识别。在多个公共数据集上的实验表明,T-LPR在复杂场景下表现优异,尤其在旋转、倾斜、扭曲车牌的识别上。
摘要由CSDN通过智能技术生成

【摘  要】近年来,基于自注意力机制的神经网络在计算机视觉任务中得到广泛的应用。随着智能交通系统的广泛应用,面对复杂多变的交通场景,车牌识别任务的难度不断提高,准确识别的需求更加迫切。因此提出一个基于自注意力的免矫正的车牌识别方法T-LPR。首先对图像进行切片和序列化,并使用3D卷积对切片序列进行特征提取,从而得到图像的嵌入向量序列。然后将嵌入向量序列输入基于Transformer Encoder的编码器中,学习各个嵌入向量之间的关系并输出最终的编码结果。最后使用分类器进行分类。在多个公共数据集上的实验结果表明,所提方法对各类困难场景下的车牌识别都非常有效。

【关键词】车牌识别 ; 图像嵌入向量 ; 自注意力 ; 免矫正

1.引言

随着城市智能管理的进一步发展,智能交通系统变得越来越重要。车牌识别作为智能交通系统中的关键一环,识别效果的好坏将会在很大程度上影响整个系统的运行。根据以往的经验,车牌识别系统的应用场景较为受限,对识别的图像要求高,如特定的拍摄角度、拍摄距离、环境光等。随着车牌识别需求的进一步提升,在非受限的场景下进行无感的车牌识别变得愈加重要,即对识别算法提出了更高的要求,需要对任意的车牌图像进行准确的识别。

在非受限的开放场景下获取的车牌图像存在许多问题,主要体现在曝光条件不一致,如夜间、白天、逆光拍摄等;天气环境不一致,如下雨导致的模糊、下雪导致的部分遮挡;拍摄角度不一致导致的倾斜、旋转等,以及其他问题导致的车牌污损、扭曲变形、模糊等。图1展示了部分典型的困难车牌样本。在过去的很长一段时间里,车牌识别由传统的图像处理技术完成,而在卷积神经网络成为视觉任务的主流方法之后,许多车牌识别方法开始基于卷积神经网

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

米朵儿技术屋

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值