深度学习概述
深度学习是机器学习领域的一个重要分支,由人工神经网络演变而来,其目的是生成一个能够模拟人脑工作的深度神经网络[6]。传统人工神经网络的网络层数较少,所以只是浅层学习,深度学习则使用一系列的非线性变换构建多个隐藏层(一般大于5层)的神经网络,从十分庞大的数据中提取出抽象的特征,从而达到提高分类和预测准确度的最终目的[4]。目前,深度学习已经在语音辨别、图像与视频分析、数据挖掘等诸多领域上有了很好的表现。
随着深度学习在学术界和工业界上的普遍认同,科研人员已经开发出了众多深度学习的开源框架,比如Google的Tensorflow,应用最为广泛的caffe,在众多机器学习算法中应用良好的PyTorch等。PyTorch是Torch7团队开发的一个基于Python语言的深度学习框架,不仅可以完成强大的GPU加速,还提供动态神经网络功能,拥有自动求导机制。本文代码就是基于Pytorch框架实现。
目前比较成熟的深度学习模型根据学习单元的不同分为深度置信网络、自动编码器和卷积神经网络(Convolutional Neural Networks,CNN)三种。研究证明[7][8]卷积神经网络在处理多维数组数据时效果较为突出,更适合图像、视频这类数据的检测与识别[4]。所以本文中选用卷积神经网络对新能源车牌照片进行特征提取。
卷积神经网络
卷积神经网络是一种多层的人工神经网络,每一层又包括多个二维的特征图,每个特征图都是由上一层的特征图得到。完整的卷积神经网络通常包括多个特征提取阶段,