CV领域常用词及其含义
一、backbone
在神经网络中,尤其是CV领域,一般先对图像进行特征提取(常见的有vggnet,resnet,inception等等),这一部分是整个CV任务的根基,因为后续的下游任务都是基于提取出来的图像特征去做文章(比如分类,生成等等)。所以将这一部分网络结构称为backbone十分形象,仿佛是一个人站起来的支柱。
详细说backbone是用来做特征提取的网络,代表网络的一部分,一般是用于前端提取图片信息,生成特征图feature map,供后面的网络使用。因为这些backbone特征提取能力是很强,并且可以加载官方在大型数据集(Pascal 、Imagenet)上训练好的模型参数,然后接自己的网络,进行finetune微调即可。
二、head
head是获取网络输出内容的网络,利用之前提取的特征,head利用这些特征,做出预测。
三、neck
是放在backbone和head之间的,是为了更好的利用backbone提取的特征。
四、bottleneck
瓶颈的意思,通常指的是网络输入的数据维度和输出的维度不同,输出的维度比输入的小了许多,就像脖子一样,变细了。经常设置的参数 bottle_num=256,指的是网络输出的数据的维度是256 ,可是输入进来的可能是1024维度的。
五、GAP
在设计的网络中经常能够看到gap这个层&#x