patch可以通俗地理解为图像块,当需要处理的图像分辨率太大而资源受限(比如显存、算力等)时,就可以将图像划分成一个个小块,这些小的图像块就是patch。
基于上述另外补充一点:为何要划分patch而不使用resize缩小分辨率呢?
通常情况下,resize没有太大问题。但在处理图像分割问题时,由于是dense prediction,属于像素级的预测,因此会尽量要求精确。
而resize操作大多是对图像进行插值处理,本质上一种滤波,在像素级别上会造成损失(对传统图像处理有了解的应该知道某些滤波效果会使图像变得模糊),即:某些位置上的像素值是通过多个位置加权计算出来的,从而限制了模型预测结果的上限。因为你给的源图像本来就是不精确的,基于这不精确的源信号作为监督,训练出来的模型性能自然就局限在那里了。
相对地,划分patch只是把原来的大图分成一个个小图,而这些小图依然是原图的部分,像素值没有改动,因而在理论上,训练出来模型的上限能够比基于resize得到的图像训练来的高。