![](https://img-blog.csdnimg.cn/20200426211737169.jpg?x-oss-process=image/resize,m_fixed,h_224,w_224)
【论文速读】
追踪最新论文,聚焦科研热点。
何处闻韶
字节跳动-抖音-算法实习生
展开
-
【论文速读】高频分量有助于解释 CNN 的泛化
作者丨深度眸来源丨机器学习算法工程师本文从一篇 CVPR2020 Oral 论文 High Frequency Component Helps Explain the Generalization of Convolutional Neural Networks 切入,从数据高低频分布上探讨 CNN 泛化能力,通过 CNN 能够捕获人类无法感知的高频成分这一现象而对所提假设进行分析。作者认为,本文是 CV 领域从业者的一篇必读论文。摘要每当我们训练完一个 CNN 模型进行推理时,一..转载 2020-11-29 10:51:46 · 1556 阅读 · 2 评论 -
【论文速读】CNN 的频域理解
作者:若羽链接:https://www.zhihu.com/question/59532432/answer/1510340606我觉得这个对我启发最大的是上海交大许志钦的工作。 https://link.zhihu.com/?target=https%3A//ins.sjtu.edu.cn/people/xuzhiqin/fprinciple/index.html他的 B 站演讲 https://link.zhihu.com/?target=https%3...转载 2020-11-23 19:37:57 · 2652 阅读 · 0 评论 -
【论文速读】Attentional Bottleneck Towards an Interpretable Deep Driving Network
Waymo 研究院新作!论文链接:https://arxiv.org/abs/2005.04298摘要深度神经网络是自动驾驶汽车的行为预测和运动生成的关键组成部分。它们的主要缺点之一是缺乏 "透明性":它们应该为触发某些行为的原因提供易于解释的理由。我们提出了一个名为 "注意力瓶颈 (Attentional Bottleneck)"的架构,旨在提高透明性。我们的关键思想是将视觉注意力与信息瓶颈结合起来,视觉注意力可以识别模型正在使用的输入的哪些方面,信息瓶颈则可以使模型只使用输入中重要的方...原创 2020-06-14 22:58:50 · 343 阅读 · 0 评论 -
【论文阅读】Domain Adaptation for Image Dehazing
来自华中科大和中科院的 CVPR 2020 图像去雾领域新作,从合成图像到真实图像又迈进一步了吗?论文链接:https://arxiv.org/pdf/2005.04668.pdf摘要近年来,使用基于学习的图像去雾方法已取得了 STOA 的性能。然而,现有的大部分方法都是在合成雾图上训练去雾模型,由于域偏移 (domain shift) (或者说是域间差异),它们对真实雾图的泛化能力较差。为解决该问题,我们提出了一种域适应范式 (domain adaptation paradigm),它...原创 2020-05-12 17:56:58 · 4204 阅读 · 0 评论 -
【论文阅读】3D-CVF: Generating Joint Camera and LiDAR Features Using Cross-View Spatial Feature Fusion for
一个多模态 (Camera + Lidar) 3D 目标检测 SOTA 方法!论文链接:https://arxiv.org/abs/2004.12636摘要本文提出了一种融合摄像机和激光雷达传感器进行三维目标检测的深层结构。由于摄像机和激光雷达的传感器信号具有不同的特性和分布,融合这两种模式有望提高三维目标检测的精度和鲁棒性。相机和激光雷达融合带来的一个挑战是,从每种成像方式获得的空间...原创 2020-04-28 15:56:48 · 1859 阅读 · 0 评论 -
【论文阅读】YOLOv4: Optimal Speed and Accuracy of Object Detection
随着 YOLO 之父退出了 CV 届,号称 YOLOv4 的“继承者”通过在原 YOLO 技术上疯狂试探了众多崭新的 Tricks,通过强大的工程实践实现了速度与精度的有效提升!(有钱真好。。。)论文链接:https://arxiv.org/abs/2004.10934v1代码链接:https://github.com/AlexeyAB/darknet摘要有大量的特征被认...原创 2020-04-24 13:26:47 · 4782 阅读 · 0 评论 -
【论文阅读】Feature Pyramid Grids
摘要特征金字塔网络 (FPN) 在目标检测领域得到了广泛的应用,以改进特征表示以更好地处理尺度变化。本文提出了一种深层的多路径金字塔 —— 特征金字塔网格 (FPG),它将特征尺度空间表示为融合了多向横向连接的而自底向上平行路径的规则网格。FPG 可以显著提高单路特征金字塔网络的性能,同时具有相似的计算成本,突出了深层金字塔表示的重要性。除了其一般的和统一的结构、用神经结构搜索发现的过于复杂的...原创 2020-04-08 12:35:15 · 1626 阅读 · 0 评论 -
【论文阅读】ResNeSt: Split-Attention Network
ResNet 改进版新作,性能强悍,在多个任务上霸榜!近年来,图像分类模型不断发展,但由于其结构简单、模块化,大多数随之出现下游应用如目标检测、语义分割等仍然采用 ResNet 变体作为 backbone。我们提出了一个模块化的分散注意力块 (Split-Attention block),使注意力能够跨越feature map group。通过堆叠这些 ResNet 风格的 Split-Attention block,我们得到了一个新的 ResNet 变体,我们称之为 ResNeSt 。我们的网络保留了整原创 2020-04-17 14:25:09 · 960 阅读 · 0 评论 -
【论文阅读】Gradient Centralization: A New Optimization Technique for Deep Neural Networks
香港理工&阿里达摩院新作,操作优雅,一行代码嵌入优化器提升性能!ArXiv 链接:https://arxiv.org/abs/2004.01461Github 链接:https://github.com/Yonghongwei/Gradient-Centralization一、摘要优化技术对有效地训练深度神经网络 (DNN) 而言具有重要意义。结果表明,利用一阶...原创 2020-04-12 19:58:51 · 1702 阅读 · 0 评论 -
【论文阅读】DR Loss: Improving Object Detection by Distributional Ranking
阿里团队新作,性能优于 Focal Loss!论文链接:https://arxiv.org/abs/1907.10156代码链接:https://github.com/idstcv/DR_loss摘要大多数目标检测算法可分为两类:二阶检测器 (two-stage) 和一阶检测器 (one-stage) 。近年来,为实现简单而有效的结构,人们致力于 one-stage检测器的研...原创 2020-04-15 11:05:50 · 1147 阅读 · 0 评论 -
【论文阅读】Probabilistic Orientated Object Detection in Automotive Radar
首个基于毫米波雷达的目标检测网络!使用了原始雷达数据 (FMCW Radar),来自米国 Xsense AI 团队。论文链接:https://arxiv.org/abs/2004.05310摘要自动雷达因其应对恶劣天气和各种照明条件的鲁棒性,已成为先进驾驶辅助系统的组成部分之一。传统的汽车雷达使用数字信号处理 (DSP) 算法将原始数据处理成稀疏的雷达 pins,但这些 pins ...原创 2020-04-15 11:50:40 · 713 阅读 · 0 评论 -
【论文阅读】Disp R-CNN: Stereo 3D Object Detection via Shape Prior Guided Instance Disparity Estimation
摘要本文提出了一种新颖的、针对立体图像对的 3D 目标检测系统 —— Disp R-CNN。近期的许多工作都是首先通过视差估计恢复点云,然后应用 3D 检测器来解决该问题。视差图是对整张图像计算得到的,不但成本很高,而且未能利用特定类别的先验信息。相比之下,我们设计了一个实例视差估计网络 (iDispNet),该网络仅预测感兴趣目标物体的像素视差,并学习特定类别的形状先验,以获得更精确的视...原创 2020-04-09 00:20:00 · 1695 阅读 · 0 评论