[计算机视觉论文速递] 2018-03-16

最新推荐文章于 2023-02-16 19:23:08 发布

Amusi（CVer）

最新推荐文章于 2023-02-16 19:23:08 发布

阅读量1.5k

点赞数

分类专栏：论文计算机视觉计算机视觉论文速递

本文链接：https://blog.csdn.net/amusi1994/article/details/79575725

版权

本文汇总了14篇关于计算机视觉的最新论文，涉及目标检测、图像分割、人脸检测、GAN应用等多个领域。文章介绍了在多光谱行人检测、旋转敏感文本检测、交通标志检测等方面的研究进展，以及利用深度学习方法解决显著性目标检测、图像分割、视觉推理等问题的创新方法。此外，还包括了图像色彩化、去马赛克和端到端唇部阅读的研究成果。

摘要由CSDN通过智能技术生成

通知：本文有14篇论文速递信息，涉及目标检测、图像分割、显著性目标检测、人脸识别和GAN等方向

目标检测

[1]《Illumination-aware Faster R-CNN for Robust Multispectral Pedestrian Detection》

Abstract：对于行人检测来说，色彩 - 热量对的多光谱图像比单一颜色通道更有效，特别是在具有挑战性的照明条件下。但是，如何有效融合这两种模式仍然缺乏研究。在本文中，我们深入比较了六种不同的卷积网络融合体系结构并分析了它们的适应性，使得vanilla architecture能够获得与最新结果相媲美的检测性能。此外，我们发现，来自彩色或热图像的行人检测可信度与照明条件相关。考虑到这一点，我们提出了一种照明感知更快的R-CNN（IAF RCNN）。具体而言，引入照明感知网络来给出输入图像的照明度量。Then we adaptively merge color and thermal sub-networks via a gate function defined over the illumination value. The experimental results on KAIST Multispectral Pedestrian Benchmark validate the effectiveness of the proposed IAF R-CNN.

arXiv：https://arxiv.org/abs/1803.05347

[2]《Rotation-Sensitive Regression for Oriented Scene Text Detection》

CVPR 2018

Abstract：自然图像中的文本具有任意方向，需要根据定向边界框进行检测。通常情况下，多导向的文本检测器往往涉及两个关键任务：1）文本存在检测，这是一个无视文本方向的分类问题; 2）面向边界框的回归，它关注文本的方向。以前的方法依赖于这两个任务的共享功能，由于两个任务不兼容导致性能下降。为了解决这个问题，我们提出对不同设计的两个网络分支提取不同特征的特征进行分类和回归。具体而言，回归分支通过主动旋转卷积滤波器来提取旋转敏感特征，而分类分支通过汇集旋转敏感特征来提取旋转不变特征。所提出的方法名为旋转敏感回归检测器（RRD），在三个面向文本的基准数据集（包括ICDAR 2015，MSRA-TD500，RCTW-17和COCO-Text）上实现了最先进的性能。此外，RRD在船舶采集数据集上实现了重大改进，证明了其在面向对象检测方面的一般性。

arXiv：https://arxiv.org/abs/1803.05265

[3]《Knowledge-based Recurrent Attentive Neural Network for Traffic Sign Detection》

Abstract：准确的交通标志检测（TSD）可以帮助驾驶员根据交通规则做出更好的决策。 TSD作为一种典型的小型物体检测问题，在自动驾驶和先进的驾驶辅助系统领域是非常重要的。但是，小物体检测仍然是一个悬而未决的问题。在本文中，我们提出了一个人脑启发网络来处理这个问题。注意机制是我们大脑的基本功能，我们使用了一种新颖的周期性注意神经网络，以精细获得的方式提高检测精度。此外，由于我们人类可以结合领域特定知识和直觉知识来解决棘手的任务，因此我们提出了一个假设，即交通标志的位置服从反向高斯分布，这意味着位置在每张图片的中心偏向附近。实验结果表明，我们的方法比目标检测中使用的几种常用方法取得了更好的性能。

arXiv：https://arxiv.org/abs/1803.05263