深度卷积神经网络中的patch

转载:https://blog.csdn.net/wills798/article/details/97974617

在阅读基于深度卷积神经网络的图像识别、分类或检测的文献时经常看到“patch”,不是很能理解,后来就总结了一下。

 

通过阅读,“patch”似乎是CNN输入图像的其中一小块,但它究竟是什么呢?当使用CNN解决问题时,“patch”什么时候开始起作用?为什么我们需要“patch”? “patch”和内核(即特征检测器)之间有什么关系?

在CNN学习训练过程中,不是一次来处理一整张图片,而是先将图片划分为多个小的块,内核 kernel (或过滤器或特征检测器)每次只查看图像的一个块,这一个小块就称为 patch,然后过滤器移动到图像的另一个patch,以此类推。

当将CNN过滤器应用到图像时,它会一次查看一个 patch 。

CNN内核/过滤器一次只处理一个 patch,而不是整个图像。这是因为我们希望过滤器处理图像的小块以便检测特征(边缘等)。这也有一个很好的正则化属性,因为我们估计的参数数量较少,而且这些参数必须在每个图像的许多区域以及所有其他训练图像的许多区域都是“好”的。

所以 patch 就是内核 kernel 的输入。这时内核的大小便是 patch 的大小。

如图,主动脉弓和心脏,绿色部分相同,而黄色部分不同。传统的CNN算法,区分效果不佳。在 Multi-Instance Multi-Stage Deep Learning for Medical Image Recognition 这篇文章中,作者针对这种场景提出了解决方法。

这样训练出的网络,就会对有区分度的patch敏感,而对无区分度的无感。

 

一个CNN层生成一个中间表示。该表示被传递到下一层。如果下一层是CNN,则应用完全相同的“patch”概念,并以完全相同的方式进行计算,即使中间表示不是您或我可以识别为“图像”的东西。

  • 7
    点赞
  • 27
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
### 回答1: 卷积神经网络(Convolutional Neural Network,CNN)在图像处理和计算机视觉任务起着重要作用。其的核心概念之一是"map"和"patch"。 "Map"指的是特征图,也可以称为卷积层的输出。对于输入图像,CNN会经过卷积操作和池化操作,逐步提取图像的特征,并生成一系列的特征图,每个特征图对应着不同的特征。 "Patch"指的是输入图像的一个局部区域。在CNN,卷积层通过滑动一个小的窗口(卷积核)在输入图像上进行卷积操作。在每次卷积操作,卷积核会与输入图像的某个位置进行逐元素相乘并相加,从而得到输出特征图的一个像素值。这个小窗口的大小就是"patch",其大小通常是卷积核的大小。 通过卷积操作,CNN可以对输入图像的不同位置进行特征提取,而不仅仅依赖于整个图像的特征。这种局部的特征提取能够更好地捕捉到图像的局部纹理、形状和结构信息。因此,"patch"的概念在卷积神经网络非常重要,它使得网络具有了位置不变性和局部感受野的特点。 总而言之,卷积神经网络的"map"表示特征图,而"patch"表示输入图像的一个局部区域。通过对输入图像的局部区域进行卷积操作,CNN可以有效地提取图像的局部特征,从而实现对输入图像的分析和处理。 ### 回答2: 卷积神经网络是一种深度学习模型,主要用于图像处理和计算机视觉任务。它采用了一种称为卷积的操作,通过应用称为卷积核的小滤波器对输入图像进行扫描和处理。 "map"(特征图)是卷积神经网络的概念,它指的是输入图像经过卷积操作后得到的输出结果。在卷积神经网络,输入图像被分为多个小块,称为"patch"(图像块)。 在卷积神经网络,输入图像通过卷积操作与卷积核进行卷积运算,每次在输入图像的一个小块上进行。这个小块就是所谓的"patch"。卷积核和输入图像的对应位置进行计算,并将计算结果作为特征图对应位置的数值。 通过在输入图像的不同位置上进行卷积操作,我们可以获得多个特征图。每个特征图对应于一种不同的卷积核。这些特征图反映了输入图像在不同位置上的不同特征信息,比如边缘、纹理、颜色等。 特征图的大小与输入图像的大小以及卷积核的尺寸有关。卷积操作会导致特征图的尺寸减小,这是因为没有足够的像素在边界上进行卷积运算。为了解决尺寸减小的问题,通常会在卷积操作之后通过一种称为"填充"的方法对特征图进行扩展。 总结来说,在卷积神经网络,"map"是指经过卷积操作后生成的特征图,"patch"是指输入图像上用于卷积操作的小块。卷积操作通过在不同位置上对输入图像的"patch"与卷积核进行卷积运算,生成不同的特征图,用于提取图像的局部和全局特征信息。 ### 回答3: 卷积神经网络是一种深度学习模型,它通过应用卷积运算来处理输入数据。卷积运算是指将一个卷积核在输入数据上滑动,计算每个位置上的内积并生成相应的特征图。 而卷积神经网络的map和patch则涉及到卷积的两个重要概念。map(特征图)是指卷积层输出的一系列二维矩阵,每个矩阵对应一个不同的特征。例如,在图像分类任务,每个特征图可能对应着图像的某个物体的边缘、纹理等信息。 而patch是指卷积核在输入数据上进行滑动时所覆盖到的小区域。例如,在图像处理,一个patch可以是原始图像的一个小方块。卷积核会对patch的数据进行卷积运算,计算出一个值,然后将这个值保存在特征图的对应位置上。通过滑动卷积核并计算每个位置上的值,最终可以得到整个特征图。 卷积神经网络通过同时学习卷积核的权重参数,以及特征图之间的关系,从而提取输入数据的高级特征。卷积层的每个卷积核都会学习不同的特征,每个特征图对应一个卷积核,因此可以提取不同类型的特征。 综上所述,卷积神经网络通过对输入数据上的小区域进行卷积运算来提取特征,生成特征图。每个特征图对应一个卷积核,表示对不同特征的提取。卷积神经网络的优势之一就是能够通过局部感受野和参数共享的方式,通过学习来实现在输入数据上的位置不变性,从而更好地应对图像、语音等具有平移不变性的数据。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值