微信公众号:小白图像与视觉
关于技术、关注
yysilence00
。有问题或建议,请公众号留言。
主题:从全连接网络一步步推导卷积神经网络
摘要:在图像分析中,卷积神经网络(简称CNN或ConvNet)比完全连接(FC)网络具有更高的时间和内存效率。但为什么?与ConvNets相比,FC网络在图像分析方面有哪些优势?ConvNet如何从FC网络派生?CNN中的卷积一词来自哪里?这些问题将在本文中得到解答。
1.简介
图像分析面临许多挑战,例如分类,对象检测,识别,描述等。例如,如果要创建图像分类器,则即使有变化(例如遮挡,照明变化,视角等。具有特征工程主要步骤的传统图像分类管道不适合在丰富的环境中工作。即使是本领域的专家,也无法给出在不同变化下能够达到高精度的单个或一组功能。受此问题的启发,特征学习的想法应运而生。会自动学习适合使用图像的功能。这就是为什么人工神经网络(ANN)是图像分析的可靠方法之一的原因。基于诸如梯度下降(GD)的学习算法,ANN自动学习图像特征。原始图像将应用于ANN,而ANN负责生成描述它的特征。
2.使用FC网络进行图像分析
让我们看看ANN如何处理图像,以及CNN为什么有效地满足其时间和内存要求,为图1中的以下3x3灰度图像生成WRT。为简单起见,给出的示例使用较小的图像尺寸和较少的神经元数量。
ANN输入层的输入是图像像素。每个像素代表一个输入。由于ANN使用1D向量而不是2D矩阵,因此最好将上述2D图像转换为1D向量,如图2所示。