基于卷积神经网络的物体识别研究与实现（论文笔记）

最新推荐文章于 2024-03-29 23:36:20 发布

leceall

最新推荐文章于 2024-03-29 23:36:20 发布

阅读量1.3w

点赞数 3

分类专栏：论文笔记

本文链接：https://blog.csdn.net/leceall/article/details/79386487

版权

本文详细介绍了基于卷积神经网络（CNN）的物体识别研究，特别是对YOLO模型的改进，包括优化损失函数、引入Inception结构和时空金字塔下采样层。实验表明，改进的YOLO模型在识别性能和时间效率上优于其他网络，具有较强的实用价值。

摘要由CSDN通过智能技术生成

2018-02-27 lecea paper大讲堂
作者：杨眷玉电子科大专业硕士 2013

Research and Implementation of Object Detection Based On Convolutional Neural Networks

摘要

物体识别是计算机视觉中的一个研究方向，也是当前比较热门的研究领域。在人们的需求不断增长的今天，物体识别在安全、科技、经济方面正在起着举足轻重的作用，安防领域和交通监管部门也对物体识别提出了迫切的要求，所以研究物体识别对社会的未来有非常重要的意义。2006 年一种新的方法深度神经网络的出现，标志着以深度学习为新纪元的时代的到来，卷积神经网络作为深度学习方法之一，凭借着优秀的性能和无限的潜力成为了竞相研究的对象，并且已经在图像识别领域取得巨大的成功。因此，基于卷积神经网络的物体识别已经成为了物体识别领域的一个研究热点。

本论文重点阐述了一个改进 YOLO 的卷积神经网络模型，改进后网络性能得到了较为明显的提升，具体的工作如下：

1．改进的模型修改了 YOLO 网络的损失函数。改进 YOLO 的模型将比例的形式替换了原有差值的形式。相对于旧的损失函数，新的损失函数显得更加灵活，对网络误差的优化更合理。

2．改进的模型在 YOLO 网络中增加了 1×1 的卷积核。这样就减少该层的参数数量，使网络各层提取的特征过渡更加平滑。

3．改进的模型采用了新的 inception 结构。因为 Inception 结构本身就有加深和加宽网络的能力，并且在增强网络性能的同时，还能减少网络参数的数量。

4．改进的模型添加了一层时空金字塔下采样层，这样就能更充分地利用原图像中的信息，增强网络的识别性能。另外，由于时空金字塔下采样层本身具有的优势，使得网络在时间性能上也有提高。

最后，在 pascal voc2007 数据库和 pascal voc2012 数据库上对改进 YOLO 的卷积神经网络进行了实验，并用混淆矩阵、时间复杂度和信息可视化三种工具对实验数据进行了分析和总结。实验的结果表明，改进 YOLO 发网络无论在识别性能方面还是在时间效率方面都领先于其他网络，并且在国际领先水平的网络面前也有一定的竞争能力。由于在时间性能上的良好表现，所以本文将该网络模型的研究成果投入到实际应用中，开发并实现了一个改进 YOLO 的卷积神经网络系统。

关键词：卷积神经网络，inception 结构，时空金字塔下采样，物体识别

Keywords: convolution neural network, inception structure model, spatio-temporal pyramid, Object recognition

第一章绪论

1.1 研究工作的背景与意义

物体识别技术是指对日常生活中图像或视频中的物体进行识别所采用的各项技术，体现了在任意环境下对观察到的物体进行检测、分割和识别的能力。

1.2 国内外发展现状

物体识别在计算机视觉领域指的是在一张图像或一组视频序列中找到给定的物体，并且能够用物体框框出物体的具体位置。

物体识别的主要步骤包括：

特征提取：在识别的前期将图像中隐含的特征表达给提取出来（尽可能多地提取图像中的特征信息）

特征处理：对提取的特征进行进一步提纯和精炼，包括特征编码、特征汇聚等处理方式。

物体分类：将前面精炼过的特征当作图像的表达去训练分类器，然后用分类器对新的图像进行分类判别。

传统的物体识别方法可以从底层特征提取、特征编码、特征汇聚和使用分类器分类这四个方面来叙述。