Hierarchical 分层的
a general-purpose
backbone 一个通用的骨干网络
图像局部性原理:
同一个物体的不同部位,或者说语义相近的不同物体,大概率会出现在相连的地方。
如何生成多尺度的特征?
卷积中,通过pooling(即池化操作)生成多尺度特征。因为每次池化,能增大感受野。
类似于卷积,swin中提出了patch merging,把相邻的小patch合成一个大patch。
![](https://img-blog.csdnimg.cn/1e947a510a0b4729a30b5fc7d0cdd8ec.png)
![](https://img-blog.csdnimg.cn/e69331323d8249a0ba80a33d26245d08.png)