卷积神经网络（CNN）图像识别知识总结

最新推荐文章于 2024-07-25 09:21:27 发布

你好，明天，，

最新推荐文章于 2024-07-25 09:21:27 发布

阅读量4.8k

点赞数 2

分类专栏： CNN 文章标签：神经网络机器学习图像识别

本文链接：https://blog.csdn.net/baidu_41774120/article/details/117325008

版权

CNN 专栏收录该内容

5 篇文章 0 订阅

订阅专栏

最近研究了一些卷积神经网络方面的知识，研究了CNN算法实现图像识别，做一些总结。

图像识别技术是人工智能的一个重要领域，它是对图像中的对象进行识别，以识别各种不同模式的目标和对象的技术。近几年，图像识别有了进一步发展，并应用到许多场景中。而且随着智能化的发展，越来越多的人意识到，利用计算机高速的计算能力来解决生活中一些高难度和高风险的问题，能够节约人力资源，提高执行效率，图像识别是智能化的表现之一，主要包括图像信息处理和数据信息的提取等内容，此外，图像数据处理还能够根据图像的特点对其进行判断匹配，让用户能够更加快速的在图片中搜索自己想要获取的信息。目前，图像识别技术的应用范围在不断扩大，并在逐步遍及多个领域。

图像识别技术作为一种工具，对人类的生活产生很多便利，现在的识别技术主要在于帮助人们解决一些问题，方便人们更好的处理事务。让机器代替人们去完成复杂繁重的工作，这一思想在机器学习的概念产生之后一直都在，也促进着图像识别的发展和研究。

可以说，机器代替人来完成某些工作是未来的发展趋势。

图像识别通常经过图像预处理（灰度化，格式化，去噪等），图像特征提取（通常就是所说的局部特征和全局特征，在CNN中，经过卷积层和池化层进行局部特征的提取，在之后的全连接层进行特征的综合分类），图像分类。

CNN中，图像的处理一般要经过多个卷积层和降采样层（池化层），以及一两个全连接层。简单地说，图像经过卷积层的卷积核处理提取一部分特征，之后经过池化层中的过滤器提取一部分特征（这部分特征是在卷积层的基础上进一步细化），最后经过全连接层（相当于分类器，有用于二分类任务的SVM，逻辑回归等），得到最终的分类结果。

卷积层：找寻样本特征。

池化层：降低不必要的冗余信息，避免过度拟合。一般采用最大池化（max_pooling），平均池化（mean_pooling）。

全连接层：将所有特征组合到一起组成一个一维数组。

dropout：为了防止过拟合问题，避免噪音和干扰项，随机的将某些特征的权值置零。

过拟合（over fitting）：测试集表现差，训练集表现好。学习的过于仔细，以至于把噪声等干扰特征也学习进去了，泛化能力不好。

欠拟合（under fitting）：测试集和训练集表现都不好。模型过于简单，没有把特征学习完全。

而SVM（支持向量机）模型中的召回率、准确率和F1指标最先适用于二分类任务，对于类似MNIST手写数据集这样一共有10个分类（即0~9）的任务，我们把所有其他的类别看做是阴性（负）样本，创造10个二分类任务。它可以帮我们在海量甚至高维度的数据中，筛选对测试任务最为有效的少数训练样本。这样不仅节省了模型学习所需要的数据内存，同时提高了模型的预测性能。当然，获得此优势需要付出更多的计算代价（CPU资源和计算时间）。所以，在实际使用时，需要权衡利弊，进而完成各自的任务。

数据降维能够规避掉大量的特征冗余和噪声，只是这个过程可能会损失一些有用的模式信息。大量实践证明，相较于损失的部分模型性能，维度压缩能够节省大量用于模型训练的时间。即PCA带来的综合效率更高。