图像分类学习笔记

最新推荐文章于 2023-06-26 15:27:27 发布

quqyyy

最新推荐文章于 2023-06-26 15:27:27 发布

阅读量1.9k

点赞数 1

文章标签：神经网络网络卷积计算机视觉

本文链接：https://blog.csdn.net/quqyyy/article/details/107219183

版权

本文是关于图像分类的学习笔记，重点介绍了CNN网络结构，包括卷积层、池化层和全连接层，以及历史上的重要模型如LeNet、AlexNet、VGGNet和ResNet的发展历程。CNN的成功在于其局部连接、权值共享和适应图像分类挑战的能力。

摘要由CSDN通过智能技术生成

图像分类学习笔记

分享下学习笔记

图片网上找的勿喷quq

2020 西瓜大视觉课学渣笔记 20***406 - cyx
同节课的兄弟仅供参考不要抄了交上去啊

一、图像分类

图像分类是计算机视觉中最基础的一个任务，从比较简单的10分类的灰度图像手写数字识别mnist，到之后的10分类cifar10，图像分类的目标是将不同的图像划分到不同的类别的同时实现最小的分类误差。具体的来说输入为RGB图像的分类任务中，图像被计算机理解为一个M * N* 3(M N由图像像素长宽决定)的矩阵或”张量”，此时图像分类的任务就是通过训练的到一个具体的函数关系能够正确的将图像矩阵映射到对应的具体类别。
如下图为CNN图像分类：
在这里插入图片描述
图像分类的传统方法如KNN，SVM在面对比较简单的数据集如MNIST手写数字数据集时有不错表现，但在面对当下下的图像分类的新挑战中往往无法行之有效。图像分类面临着如，视角变化，光照条件，形状，大小变化，遮挡，背景干扰，类内差异的诸多挑战，面对以上所有变化及其组合，好的图像分类模型能够在维持分类结论稳定的同时，保持对类间差异足够敏感。而CNN卷积神经网络能够很好的适应图像分类问题的新挑战。
CNN本质上是一个多层感知机，其成功的原因关键在于它所采用的局部连接和共享权值的方式，一方面减少了的权值的数量使得网络易于优化，另一方面降低了过拟合的风险。CNN是神经网络中的一种，它的权值共享网络结构使之更类似于生物神经网络，降低了网络模型的复杂度，减少了权值的数量。该优点在网络的输入是多维图像时表现的更为明显，使图像可以直接作为网络的输入，避免了传统识别算法中复杂的特征提取和数据重建过程。在二维图像处理上有众多优势，如网络能自行抽取图像特征包括颜色、纹理、形状及图像的拓扑结构；在处理二维图像问题上，特别是识别位移、缩放及其它形式扭曲不变性的应用上具有良好的鲁棒性和运算效率等。