cv领域一般先对图像进行特征提取(常见的特征提取网络有vgg,resnet,inception,因为这这些backbone的特征提取能力很强,并且可以加载在大型数据集如Pascal,Imagenet上官方训练好的模型参数,这样只需在在自己的网络上进行微调就能得到新的模型参数了),生成特征图,供后面的网络部分使用
也就是说,网络中用来做特征提取的部分就叫backbone
以unet为例,是一个对称结构,左边是主干特征提取网络,右边是加强特征提取网络
我们可以采用VGG16来实现主干特征提取网络,这样就可以方便使用imagenet上的预训练权重