![](https://img-blog.csdnimg.cn/20201014180756926.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
论文解读
文章平均质量分 91
极市平台
这个作者很懒,什么都没留下…
展开
-
CVPR22 Oral|让ResNet-50精度高达82.8%,ViT原作者的知识蒸馏新作
作者丨ChaucerG来源丨集智书童编辑丨极市平台Knowledge distillation:A good teacher is patient and consistent论文:https://arxiv.org/abs/2106.05237在计算机视觉方面,实现最先进性能的大型模型与实际应用中简单的模型之间的差距越来越大。在本文中,将解决这个问题,并显著地弥补这2种模型之间的差距。在实证研究中,作者的目标不是一定要提出一种新的方法,而是努力确定一种稳健和有效的配置方案,使最先进的大模型在转载 2022-05-18 11:18:26 · 566 阅读 · 0 评论 -
圆形的CNN卷积核?华中科大&清华黄高团队&康奈尔提出圆形卷积,进一步提升卷积结构性能!
作者丨小马编辑丨极市平台写在前面目前正常卷积的感受野大多都是一个矩形的,因为矩形更有利于储存和计算数据的方便。但是,人类视觉系统的感受野更像是一个圆形的。因此,作者就提出,能不能将CNN卷积核的感受野也变成圆形呢?作者通过一系列实验,发现了圆形的卷积核确实比方形的卷积效果会更好。基于此,作者在本文中提出了一种卷积核大小可变的并且聚合了方形和圆形特点的集成卷积核。作者在模型训练结束后,采用了一种重参数的方法对模型的结构和参数进行修改,使得模型在inference的时候并没有引入额外的参数量和计算量。最终原创 2021-07-13 11:18:13 · 664 阅读 · 0 评论 -
Multi-Scale Densenet续作?搞定Transformer降采样,清华联合华为开源动态ViT!
作者丨小马编辑丨极市平台先验知识Transformer最近在CV领域展现出了不错的效果,Vision Transformer(ViT)的大致流程可分为两步:1)因为Self-Attention(SA)的计算复杂度是和输入特征的大小呈平方关系的,所以如果直接将224x224的图片输入到Transformer中,会导致计算量的“爆炸”。因此,ViT的第一步是将图片转换成更小的token(比如16x16),然后将这些token进行flatten后输入到Transformer中。2)利用Transform原创 2021-07-09 14:53:47 · 656 阅读 · 0 评论 -
超越Swin,Transformer屠榜三大视觉任务!微软推出新作:Focal Self-Attention
作者丨小马编辑丨极市平台写在前面VIsion Transformer(ViT)和它的一系列变种结构在CV任务中取得了不错的成绩,在其中,Self-Attention(SA)强大的建模能力起到了很大的作用。但是SA的计算复杂度是和输入数据的大小呈平方关系的,所以针对一些需要高分辨率的CV任务(e.g., 检测、分割),计算开销就会很大。 目前的一些工作用了局部注意力去捕获细粒度的信息,用全局注意力去捕获粗粒度的信息,但这种操作对原始SA建模能力的影响,会导致sub-optimal的问题。因此,本文提出了原创 2021-07-09 14:51:53 · 1641 阅读 · 0 评论 -
CNN 与 Transformer 的强强联合!谷歌最新开源 BoTNet,ImageNet 达 84.7%准确率
Conv+Transformer=BotNet,这是伯克利、谷歌最新提出的工作BotNet,它充分利用了CNN与自注意力的优势,在ImageNet上取得了84.7%的top1精度,同时文中各种实验分析也相当的详细。本文首发于极市平台,作者Happy。转载请注明来源。本文是伯克利与谷歌的研究在Convolution+Transformer组合方面一个探索,它采用混合方式同时利用了CNN的特征提取能力、transformer的内容自注意力与位置自注意力机制,取得了优于纯CNN(如ResNet、Effi原创 2021-01-29 12:28:19 · 1921 阅读 · 2 评论 -
通道注意力新突破!从频域角度出发,浙大提出FcaNet:仅需修改一行代码,简洁又高效
该文是浙江大学提出一种的新颖的通道注意力机制,它将通道注意力机制与DCT进行了巧妙的结合,并在常规的通道注意力机制上进行了扩展得到了本文所提出的多谱通道注意力机制:FcaLayer。作者在图像分类、目标检测以及实例分割等任务上验证了所提方案的有效性:在ImageNet分类任务上,相比SENet50,所提方法可以取得1.8%的性能提升。Abstract注意力机制(尤其是通道注意力)在CV领域取得了极大的成功,然这些工作往往聚焦于如何设计有效的通道注意力机制同时采用GAP(全局均值池化)作为预处理方法。本.原创 2020-12-25 11:17:17 · 972 阅读 · 1 评论 -
AdvFlow:一种基于标准化流的黑盒攻击新方法,产生更难被发觉的对抗样本 | NeurIPS‘20
本文提出一种新的黑盒对抗攻击方法AdvFlow,通过利用标准化流来建模对抗样本的数据分布,使得生成的对抗样本的分布和正常样本接近,从而让对抗样本更难被检测出来,打破了对抗样本和正常样本的分布大不相同的固有认知。论文地址:https://arxiv.org/abs/2007.07435论文代码:https://github.com/hmdolatabadi/AdvFlow本文为极市原创投稿,转载请获得授权。引言虽然神经网络在很多机器学习任务上都取得了非凡的表现,但是通过对输入样本添加微小的扰动原创 2020-12-08 10:58:38 · 1102 阅读 · 0 评论 -
SWideRNet:全景分割新标杆!
paper: https://arxiv.org/abs/2011.11675本文为极市原创投稿,转载需获授权该文是DeepLab系列作者“Liang-Chieh Chen”大神在全景分割领域的又一力作。它在Wide-ResNet的基础上引入SE与"Switchable Atrous Convolution,SAC"两种改进,嵌入到Panoptic-DeepLab框架中并在全景分割领域取得了SOTA性能(在更快or更大模型配置方面均取得了SOTA指标)。AbstractWide-ResNet是.原创 2020-12-04 10:41:08 · 170 阅读 · 0 评论 -
首次摆脱对梯度的依赖,CMU等开源Score-CAM:基于置信分数的视觉可解释性
本文介绍一篇被CVPRW2020接受的论文,主要关于一种基于置信分数的视觉可解释性方法。本文的亮点在于:在CAM系列方法的基础上,首次提出了一种新的gradient-free的权重表达方式。本文首发自极市平台,作者王浩帆,转载需获授权。论文:Score-CAM:Score-Weighted Visual Explanations for Convolutional Neural Networks官方代码:https://github.com/haofanwang/Score-CAM本文是由来自原创 2020-12-04 10:21:39 · 607 阅读 · 0 评论 -
Transformer再下一城!low-level多个任务榜首被占领,北大华为等联合提出预训练模型IPT
来自Transformer的降维打击!北京大学等最新发布论文,联合提出图像处理Transformer。通过对low-level计算机视觉任务,如降噪、超分、去雨等进行研究,提出了一种新的预训练模型IPT,占领low-level多个任务的榜首。本文首发自极市平台,作者@Happy,转载需获授权。paper: https://arxiv.org/abs/2012.00364该文是清华大学&华为诺亚等联合提出的一种图像处理transformer。Transformer自提出之日起即引起极大的原创 2020-12-03 10:51:18 · 748 阅读 · 3 评论 -
何恺明团队最新力作SimSiam:消除表征学习“崩溃解”,探寻对比表达学习成功之根源
该文是FAIR的陈鑫磊&何恺明大神在无监督学习领域又一力作,提出了一种非常简单的表达学习机制用于避免表达学习中的“崩溃”问题,从理论与实验角度证实了所提方法的有效性;与此同时,还侧面证实了对比学习方法成功的关键性因素:孪生网络。paper: https://arxiv.org/abs/2011.10566本文为极市平台原创,作者Happy,转载需获授权。Abstract孪生网络已成为无监督表达学习领域的通用架构,现有方法通过最大化同一图像的两者增广的相似性使其避免“崩溃解(collap原创 2020-11-24 15:48:00 · 1893 阅读 · 1 评论 -
Graph Normalization (GN):为图神经网络学习一个有效的图归一化
摘要作者在不同任务中尝试了节点式归一化(Node-wise),邻接式归一化(Adjance-wise),图式归一化(Graph-wise)和批处理归一化(Batch-wise)作为归一化计算方式,来分析每种归一化方式的优劣,并提出一种基于学习的四合一自动加权组合的方式来学习适合当前任务的图归一化。Paper:Learning Graph Normalization for Graph Neural Networkshttps://arxiv.org/abs/2009.11746Source Cod原创 2020-11-19 15:38:47 · 1072 阅读 · 0 评论 -
YOLOv4团队开源最新力作!1774fps、COCO最高精度,分别适合高低端GPU的YOLO
该文是YOLOv4的原班人马(包含CSPNet一作与YOLOv4一作AB大神)在YOLO系列的继续扩展,从影响模型扩展的几个不同因素出发,提出了两种分别适合于低端GPU和高端GPU的YOLO。该文所提出的YOLO-large在MSCOCO取得前所未有的精度(已公开的研究成果中最佳),且可以保持实时推理;所提出的YOLO-tiny在RTX 2080Ti显卡上结合TensorRT+FP16等技术,可以达到惊人的1774FPS@batch=4.本文首发自极市平台,作者@Happy,转载需获授权。Scal原创 2020-11-18 10:20:53 · 773 阅读 · 1 评论 -
图像增强领域大突破!以 1.66ms 的速度处理 4K 图像,港理工提出图像自适应的 3DLUT
paper: https://www4.comp.polyu.edu.hk/~cslzhang/paper/PAMI_LUT.pdfcode: https://github.com/HuiZeng/Image-Adaptive-3DLUT(即将开源)该文是香港理工大学张磊老师及其学生在图像增强领域的又一颠覆性成果。它将深度学习技术与传统3DLUT图像增强技术详解,得到了一种更灵活、更高效的图像增强技术。所提方法能够以1.66ms的速度对4K分辨率图像进行增强(硬件平台:Titan RTX GPU)。.原创 2020-09-28 15:12:14 · 1297 阅读 · 0 评论 -
与 SENet 互补提升,华为提出自注意力新机制:Weight Excitation
注意力机制、动态卷积最近几年被研究得非常透了,不过前述方法大多聚焦于特征图层面,而该文则是从权值角度出发提出了一种非常有意思的机制。该文所提方法仅作用于训练阶段,不会对推理造成任何的计算量消耗、网络结构改变,同时可取得媲美SE的性能提升,更重要的是它可以与SE相互促进。论文:http://www.ecva.net/papers/eccv_2020/papers_ECCV/papers/123750086.pdfAbstract该文提出一种新颖的方法用于在训练阶段同时判别卷积神经网络权值的重要性并对.原创 2020-09-24 17:52:07 · 501 阅读 · 0 评论 -
Label Assign综述:提升目标检测上限
原文链接:https://bbs.cvmart.net/topics/2960专注计算机视觉前沿资讯和技术干货微信公众号:极市平台官网:https://www.cvmart.net/最近因为AutoAssign这篇paper的原因,再加上之前对目标检测中label assign问题很感兴趣, 看了几篇label assign相关论文(FreeAnchor、ATSS、AutoAssign),梳理一下几篇论文的关系做个记录~~我用一张图大致梳理出几个label assign相关论文的关系Free原创 2020-08-15 12:14:45 · 849 阅读 · 0 评论 -
通道注意力超强改进,轻量模块 ECANet 来了!即插即用,显著提高 CNN 性能|已开源
原文链接:通道注意力超强改进,轻量模块 ECANet 来了!即插即用,显著提高 CNN 性能|已开源本文原创首发自极市平台公众号,请授权后转载。极市导读:今天给大家推荐一篇CVPR2020上对通道注意力进行改进的文章—ECANet,ECANet主要对SENet模块进行了一些改进,提出了一种不降维的局部跨信道交互策略(ECA模块)和自适应选择一维卷积核大小的方法,从而实现了性能上的提优。最近已经有很多文章在通道和空间注意力上做改进并取得了性能提升。例如SKNet,SANet,ResNeSt等等,不得不说,原创 2020-07-02 10:33:48 · 11128 阅读 · 1 评论 -
重磅!就在刚刚,吊打一切的 YOLOv4 开源了!
Tips◎作者系极市原创作者计划特约作者Happy欢迎大家联系极市小编(微信ID:fengcall19)加入极市原创作者行列早上刷到YOLOv4之时,非常不敢相信这是真的!paper:https://arxiv.org/pdf/2004.10934.pdf,code:https://github.com/AlexeyAB/darknet核心中的核心:作者将Weighted-Re...原创 2020-04-24 14:59:41 · 33201 阅读 · 1 评论 -
CVPR2020 | 参数量减半,北大开源全新高效空域转换模块,还原图像逼真细节
◎本文为极市开发者「可乐」原创投稿,转载请注明来源。◎极市「论文推荐」专栏,帮助开发者们分享自己的最新工作,欢迎大家投稿。联系极市小编(ID:fengcall19),备注:投稿,即可投稿~很多图像生成任务都需要在空域对输入图像进行移动和重新排列。然而,卷积神经网络难以进行高效的空域转换操作。近日,来自北大和鹏城实验室的研究者们提出了一种全新的空域转换模块Global-Flow Local-A...原创 2020-04-03 10:06:11 · 943 阅读 · 0 评论 -
CVPR 2020 Oral 汇总:论文 / 代码 / 解读(更新中)
在2月24日,CVPR 2020 公布接收论文结果公布,从 6656 篇有效投稿中录取了 1470 篇论文,录取率约为 22%。3月13日,CVPR Oral结果公布了。有大佬已经分享了自己的工作,本文整理了已中Oral的论文,持续更新,分享给大家阅读。关注 极市平台,获取最新CV干货10.PolarMask: 一阶段实例分割新思路[1,2]论文地址:PolarMask: Single S...原创 2020-03-17 11:58:46 · 5639 阅读 · 0 评论 -
ICCV 2019 最佳论文和最佳学生论文下载
ICCV 2019最佳论文和最佳学生论文已出炉!最佳论文SinGAN:LearningaGenerativeModelfromaSingleNaturalImage用一张自然图片,学出一个生成模型作者:Tamar Rott Shaham,Technion;Tali Dekel ,Google Research;Tomer Michaeli ,Technion摘要:我们介绍SinGAN...原创 2019-10-29 12:30:43 · 2030 阅读 · 0 评论 -
CVPR 2018 论文解读集锦(9月26日更新)
本文为极市平台原创收集,转载请附原文链接:CVPR 2018已经顺利闭幕,目前已经公布了所有收录论文名单和最佳论文,为了能够让大家更深刻了解CVPR的论文,我们进行了一些CVPR 2018论文解读的整理,后续还会持续更新。同时我们也对ECCV、ICCV等解读文章进行了整理,欢迎关注。CVPR 2017 论文解读集锦ICCV 2017 论文解读集锦NIPS 2017 论文解读集锦(12-1...原创 2018-09-18 15:00:21 · 3975 阅读 · 0 评论 -
ECCV 2018 | CornerNet:目标检测算法新思路
本文为极市平台原创文章,转载请附原文链接:作者:陈泰红论文地址:https://arxiv.org/abs/1808.01244本文首发于极市博客1 目标检测算法概述CornerNet是密歇根大学Hei Law等人在发表ECCV2018的一篇论文,主要实现目标检测。在开始介绍CornerNet论文之前,先复习一下目标检测领域的主流算法,因为作者提出的算法和主流算法很多不一样。深度方...原创 2018-09-21 11:43:02 · 1984 阅读 · 0 评论 -
ECCV 2018 | OR-CNN行人检测:为‘遮挡’而生
作者:Panzer论文地址:https://arxiv.org/abs/1807.08407本文首发于极市博客背景介绍与通用目标检测相比,遮挡情况在行人检测中更为普遍,为此也是行人检测领域最广为关注的问题之一。现实场景中行人的遮挡情况主要分为两种情况:一种是行人个体之间的相互遮挡,这往往会引入大量的干扰信息,进而导致虚检;一种是其他物体对行人的遮挡,这往往会带来目标信息的缺失,进而导致漏...原创 2018-09-21 15:16:25 · 7412 阅读 · 4 评论 -
ECCV 2018 | Bi-box行人检测:‘行人遮挡’为几何?
极市平台是专业视觉算法平台,主要为开发者提供真实项目需求,视觉算法开发等服务,点击填表加入极市专业CV交流群,与6000+来自腾讯,华为,百度,北大,清华,中科院等名企名校视觉开发者互动交流!更有机会与李开复老师等大牛群内互动!同时提供每月大咖直播分享、真实项目需求对接、干货资讯汇总,行业技术交流。扫描以下二维码,立刻申请入群~“本文是ECCV2018处理行人检测中遮挡问题的又一篇力作,通...原创 2018-09-30 10:04:11 · 3995 阅读 · 6 评论 -
NIPS 2018 论文解读集锦(11月28日更新)
今年我们整理过视觉顶级会议CVPR 2018论文解读集锦 和 ECCV 2018论文解读集锦,并持续更新中,如今备受瞩目的NIPS 2018也将于12月举行,目前已经公布了所有收录论文名单,为了能够让大家更深刻了解前沿技术及论文资讯,我们进行了一些NIPS 2018优秀论文解读的整理,欢迎大家收藏交流。NIPS 2018收录文章:https://nips.cc/Conferences/2018...原创 2018-10-30 11:47:49 · 4634 阅读 · 0 评论 -
[CVPR2019]:专门为卷积神经网络设计的训练方法:RePr
作者 | ywsun论文链接 | https://arxiv.org/abs/1811.07275原文地址 | https://zhuanlan.zhihu.com/p/58095683加入**专业CV社区**,获取更多高质量干货CVPR2019年的一篇文章 RePr: Improved Training of Convolutional Filters这篇文章初看abstract...转载 2019-03-08 20:53:58 · 1240 阅读 · 0 评论 -
Google又发大招:高效实时实现视频目标检测
首发于极市平台微信号:Google又发大招:高效实时实现视频目标检测作者:陈泰红如有兴趣可以**点击加入极市CV专业微信群**,获取更多高质量干货图像目标检测是图像处理领域的基础。自从2012年CNN的崛起,深度学习在Detection的持续发力,为这个领域带来了变革式的发展:一个是基于RPN的two-stage,RCNN/Fast RCNN/Faster RCNN、RetinaNet、...原创 2019-04-02 20:51:31 · 3505 阅读 · 1 评论 -
ECCV 2018论文解读及资源集锦(10月17日更新,含全部论文下载链接)
之前我们整理了CVPR 2018 论文解读集锦和历年VALSE 视觉资源汇总(两篇都仍在更新中),目前计算机视觉三大顶级会议之一的ECCV,European Conference on Computer Vision(欧洲计算机视觉国际会议) ,将于2018年9月8日在德国慕尼黑举行,目前已经逐渐公开接收论文名单,为了能够让大家更集中深刻地了解ECCV2018的优秀论文,极市为大家整理了一些ECC...原创 2018-08-20 17:41:38 · 17118 阅读 · 2 评论