论文阅读——UniRepLKNet

最新推荐文章于 2024-11-02 20:44:23 发布

じんじん

最新推荐文章于 2024-11-02 20:44:23 发布

阅读量3.5k

点赞数 13

分类专栏：论文文章标签：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43575791/article/details/135216124

版权

论文专栏收录该内容

68 篇文章

订阅专栏

文章介绍了一种新型网络结构UniRepLKNet，它在大卷积核架构中解耦了感受野扩大、抽象层次提升和参数增加的效果。该网络利用膨胀卷积和ReparamBlock，以高效地处理音频、视频等多种类型的数据识别任务。通过不同模块和模型大小的设计，展示了在各种任务中的优秀性能。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

UniRepLKNet: A Universal Perception Large-Kernel ConvNet for Audio, Video, Point Cloud, Time-Series and Image Recognition

当我们将一个3×3的conv添加到一个小卷积核ConvNet中时，我们预计它会同时产生三种效果——1）使感受野更大，2）增加空间模式的抽象层次（例如，从角度和纹理到对象的形状），3）通过使其更深入，引入更多可学习的参数和非线性，来提高模型的一般表示能力。相比之下，我们认为，在大卷积核架构中，这三种影响应该解耦，因为模型应该利用大卷积核的实质性优势——即不深入就可以看到广泛的东西。由于在扩大感受野时，增加卷积核大小比堆叠更多层要有效得多，因此可以用少量的大卷积核层来建立足够的ERF，从而可以为其他有效结构节省计算预算，这些结构在增加空间模式的抽象层次或通常增加深度方面更有效。

Dilated Reparam Block

膨胀卷积中忽略输入的像素相当于将额外的零项插入到conv卷积核中，因此具有小卷积核的膨胀conv层可以等效地转换为具有稀疏较大内核的非膨胀（即，r=1）层。

原来的卷积核：

插零后：

可以通过步长为r的转置卷积实现：

Reparam块，它使用一个非膨胀的小卷积核和多个膨胀的小卷积核层来增强非膨胀的大卷积核conv层。大核大小K，平行的卷积层大小k，膨胀率r，

另外设计了四个结构加深模型：

不同卷积核：

不同模块：

不同大小模型：

在不同任务的表现：

博客等级

码龄7年

170
原创

715
点赞

815
收藏

506
粉丝

关注

私信

热门文章

分类专栏

杂七杂八 7篇
论文 68篇
数学 12篇
data structures 5篇
机器学习 21篇
计算机编程 17篇
强化学习 3篇
计算机视觉 1篇
NLP 14篇
3D 8篇
深度学习 9篇
射影几何 5篇

展开全部收起

最新评论

矩阵分析及应用（1-2章）
jack_tony70: 請問這是哪本書呢？還是書名就叫做「矩陣分析及應用」？
论文阅读——Unified Generative Adversarial Networks for Controllable Image-to-Image Translation
普通网友: 写的很好，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
论文阅读——Unified Generative Adversarial Networks for Controllable Image-to-Image Translation
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
论文阅读——MVDiffusion
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
论文阅读——Sat2Vid
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。

大家在看

最新文章

目录

展开全部

收起

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。