基于BoF结合卷积神经网络的图像分类方法的研究

针对传统DCNN模型中Softmax分类器存在的过早饱和及模型参数采用随机初始化训练时间长、识别准确率低的问题,文章提出一种将噪声注入Softmax并结合迁移学习的图像分类方法。
卷积神经网络是一种为了处理二维图像而设计的人工神经网络,对翻转、平移和比例缩放等变换具有高度鲁棒性。通过简单节点进行非线性组合而具有高度的表达能力和强大的分类能力,使用基于卷积神经网络的分类算法对图像分类问题可以较明显的提高分类效果。因此,卷积神经网络成为深度学习在图像识别领域最常用的模型。在经典的CNN中,开始几层通常是卷积层和池化层的交替,最后几层是全连接层。训练过程主要是学习卷积核参数和层间连接权重等网络参数,预测过程主要是基于输入图像和网络参数计算各类别标签概率。卷积神经网络的关键是搭建合适的网络结构,包含卷积层、池化层、全连接层和反向传播算法。
卷积层是卷积神经网络的核心组成部分,它集中了整个网络大部分的计算量,卷积层的参数是由一组可学习的滤波器组成,每个滤波器都是一个宽度和高度较小的滑窗,并且可以遍历整张输入图像。
池化层又称为下采样层,其作用是逐步缩小卷及操作后激活的尺寸,从而减少网络中的参数和计算量,从而有效避免过拟合现象的发生。池化操作可以在图像每个深度上独立地进行,通常采用最大池化方法。
全连接层网络结构和普通神经网络的结构是一样的,全连接层中的神经元与前一层的所有神经元都完全连接,但是层内神经元没有连接。
LeNet网络是卷积神经网络的鼻祖,它是由两组卷积层后紧跟下采样层和三个全连接层构成,起初是Yann LeCun是为了解决手写数字识别而设计的,并达到了很高的准确率。
迁移学习,在解决目标领域具体任务时,无法得到构建模型所需规模的训练数据,故将源领域学习到的知识应用到目标域中的一种技术。通过使用之前在大数据集上经过训练并表现优秀的预训练模型,将其相应的结构和权重应用到目标域中去,这样不仅大大缩短了训练时间,还避免了由数据规模过小而引发的过拟合现象。
:文章选自《基于BoF结合卷积神经网络的图像分类方法的研究》杨东旭

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

毛毛真nice

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值