公众号内容拓展学习笔记(2022.3.6)
📎 今日要点
-
CVPR 2022 | 超越Transformer!FAIR重新设计纯卷积架构:ConvNeXt ⭐️⭐️
- Abstract: 超越Transformer!FAIR重新设计纯卷积架构:ConvNeXt
- Paper: A ConvNet for the 2020s
- Code: https://github.com/facebookresearch/ConvNeXt
- Tips: 完全标准ConvNet模块构建的ConvNeXt取得了优于Transformer的精度87.8%,在COCO检测与ADE20K分割任务上超越了SwinTransformer,同时保持了ConvNet的简单性与高效性。
-
YOLOS:通过目标检测重新思考Transformer(附源代码) ⭐️⭐️
- Abstract: YOLOS:通过目标检测重新思考Transformer
- Paper: You Only Look at One Sequence: Rethinking Transformer in Vision through Object Detection
- Code: https://github.com/hustvl/YOLOS
- Tips: 我们发现仅在中等大小的ImageNet-1k数据集上预训练的YOLOS已经可以在COCO上实现具有竞争力的目标检测性能,例如直接从BERT-Base中采用的YOLOS-Base可以实现42.0 box AP。研究者还通过目标检测讨论了当前预训练方案和模型缩放策略对Transformer在视觉中的影响和局限性。
-
You’re AllSet! 以多重集函数角度重新检视超图GNN ⭐️⭐️
- Abstract: 以多重集函数角度重新检视超图GNN
- Paper: You are AllSet: A Multiset Learning Framework for Hypergraph Neural Networks.
- Code: https://github.com/jianhao2016/AllSet
- Tips: 我们针对超图神经网络提出了一个泛用的框架AllSet,我们证明了大部分现有超图神经网络层的表达能力皆严格弱于AllSet,且证明了AllSet为MPNN的超图推广。我们利用近年深层多重集函数学习的结果,结合AllSet概念设计出可学习的AllSet层AllSSetTransformer。
-
ETH联合Meta和鲁汶大学 提出视频恢复算法VRT,在视频超分辨率、去模糊和去噪性能达到SOTA ⭐️⭐️
- Abstract: ETH联合Meta和鲁汶大学 提出视频恢复算法VRT,在视频超分辨率、去模糊和去噪性能达到SOTA
- Paper: VRT: A Video Restoration Transformer
- Code: https://github.com/JingyunLiang/VRT
- Tips: 该论文为将Swin Transformer应用于单图超分中的SwinIR的视频扩展版本,在视频复原的各领域中都有很大的提升,本文将从视频超分方向来解读VRT。
-
论文解释:SeFa ,在潜在空间中为 GAN 寻找语义向量 ⭐️⭐️
- Abstract: SeFa ,在潜在空间中为 GAN 寻找语义向量
- Paper: Closed-Form Factorization of Latent Semantics in GANs
- Tips: 论文提出了一种名为 SeFa 的封闭形式和无监督方法,可以无需数据采样和模型训练并找出这些方向向量来改变输出图像中的不同属性。
-
开源真实场景图像检测数据集汇总 ⭐️⭐️
- Abstract: 开源真实场景图像检测数据集汇总
- Tips: 本文汇总了九个图像检测相关的真实场景数据集,附有下载链接