【组会整理及心得】FasterNet、LocalMIM

【CVPR2023】Run, Don't Walk: Chasing Higher FLOPS for Faster Neural Networks

Run, Don't Walk: Chasing Higher FLOPS for Faster Neural Networks - 知乎

【本文贡献】

  1. 本文指出了实现更高的FLOPS相比简单地减少更快的神经网络的FLOPs的重要性。
  2. 引入了一个简单而快速有效的部分卷积,称为 PConv,它很有可能替换现有的DWConv。
  3. 引入了FasterNet,它在GPU、CPU和ARM处理器等各种设备上运行有效且普遍快速。

【网络结构】

延迟Latency=FLOPs/FLOPS,其中FLOPS是floating-point operations per second的缩写,指的是每秒浮点运算次数,用来衡量硬件的性能;FLOPs是floating point of operations的缩写,是浮点运算次数,可以用来衡量算法/模型复杂度。

本文提出的新的部分卷积PConv利用了特征图在不同通道上的相似性和冗余,只在一部分输入通道上使用常规卷积进行空间特征提取,它的FLOPs低于常规卷积,而FLOPS高于DWConv/GConv,并且能更好提取空间特征。对于连续或规则的内存访问,将第一个或最后一个连续的通道视为用于计算的整个特征图的代表,在不失一般性的情况下,认为输入和输出特征图具有相同数量的通道,此时PConv的FLOPs仅为常规卷积的1/16,内存访问量仅为常规卷积的1/4。

为了充分利用来自所有通道的信息,本文进一步将PWConv附加到PConv。

FasterNet结构如下图,其中只把标准化和激活函数层放在每个中间PWConv之后,保持特征多样性并实现较低的延迟,此外,将BN合并到相邻的Conv层中,以便更快地进行推断。激活函数选择GELU。

【心得体会】

设计适合移动端的轻量级网络的时候或许可以考虑用类似PConv的卷积。

【CVPR2023highlight】Masked Image Modeling with Local Multi-Scale Reconstruction

【CVPR2023】Masked Image Modeling with Local Multi-Scale Reconstruction - 知乎

【本文贡献】

提出了LocalMIM,这是目前已知的MIM进行局部重建并使用输入的多尺度监督的第一项工作,该模型与架构无关,可用于柱状和金字塔结构。

【网络结构】

先将图片分块,形成patches作为ViT的输出,再在多个局部层预测它们不同尺度的监督信号,将patches映射到patch embeddings,并添加位置编码来保留位置信息。多尺度监督首先划分不同尺度的输入,然后用一些特征描述符完成信号的提取。底层负责精细尺度重建,顶层负责粗尺度重建。这里的解码器由Transformer 块、反卷积(或池化)和MLP组成。

【心得体会】

目前的MIM主要有两个地方待改进,一个是计算量大,一个是学习慢,可以尝试用局部重建的方式来改进。

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Python提供了许多不同类型的组合数据类型,包括列表、元组、集合和字典。这些数据类型有着不同的特点和用途,可以根据具体的需求来选择使用。 列表是最常用的组合数据类型之一,可以存储任意类型的数据,可以对其中的元素进行增删改查等操作。列表是可变的,也就是说可以对其进行修改,但是这也使得列表的操作会比较消耗资源。 元组和列表类似,也可以存储任意类型的数据,但是元组是不可变的,也就是说不能对其中的元素进行修改。元组的优势在于其不可变性,可以使得程序更加安全和稳定。 集合是一种无序的数据类型,可以用于去重和判断元素是否存在于集合中。集合中只能存储不可变类型的数据,例如字符串、数字和元组等。集合的操作速度比列表和元组要快。 字典是一种键值对的数据类型,可以用于存储一些有关联的数据,例如学生的姓名和成绩等。字典中打开失败!" << endl; return; } string type; while (inFile >> type) { if (type == "StudentInfo") { StudentInfo stuInfo; inFile >> stuInfo.stuNo; inFile >> stuInfo.name; inFile >> stuInfo.major; inFile >> stuInfo.className; inFile >> stuInfo.borrowedBooks; stuVec.push_back(stuInfo); } else if (type == "BookInfo") { BookInfo bookInfo; inFile >> bookInfo.bookNo; inFile >> bookInfo.isbn; inFile >> bookInfo.bookName; inFile >> bookInfo.author; inFile >> bookInfo.price; inFile >> bookInfo.stock; inFile >> bookInfo.publishTime; inFile >> bookInfo.publisher; inFile >> bookInfo.status; bookVec.push_back(bookInfo); } else if (type == "BorrowInfo") { BorrowInfo borrowInfo; inFile >> borrowInfo.borrowNo; inFile >> borrowInfo.stuNo; inFile >> borrowInfo.bookNo; inFile >> borrowInfo.borrowTime; inFile >> borrowInfo.returnTime; borrowVec.push_back(borrowInfo); } } inFile.close(); } ```

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值