UniRepLKNet: Universal Perception Large-Kernel ConvNet模型结构和代码结构解读

Soonki

已于 2024-03-13 16:41:22 修改

阅读量1.2k

点赞数 14

分类专栏： OT论文解读文章标签：计算机视觉

于 2024-03-06 17:04:26 首次发布

本文链接：https://blog.csdn.net/Soonki/article/details/136509530

版权

15 篇文章

订阅专栏

简介

在ConvNet中，我们不断添加 $3×3 \times 3 }$ 或者 $5×5 \times 5 }$ 的小核卷积，：

但是，作者有自己想法：

UniRepLKNet

作者针对上面的问题，提出了4条设计网络的指导方针：

使用高效的结构增加深度：推荐使用如SE Blocks（Squeeze-and-Excitation Blocks）这样的结构来增加网络的深度，图中的(D)就是；
- 使用“DilatedReparamBlock”重新参数化：提出了一种名为DilatedReparamBlock的结构，我个人理解，这就是把一个超大核心的卷积核，分解成一个个小的空洞卷积，在图中找到对应模块，我们可以发现大核kernel_size会对应不同的小核kernel_sizes列表和dilateds列表，由他们组合卷积的参数列表；
根据下游任务决定卷积核大小：建议根据具体任务的需求来选择合适的卷积核大小，并通常只在网络的中间层和高层使用大型卷积核；
在增加模型深度时添加3×3卷积：在扩展模型深度时，建议添加3×3的卷积层而不是更多的大型卷积核。