每天一篇论文365
文章平均质量分 78
流浪机器人
机器人科学与工程在读博士
研究方向-语义分割,深度估计,3D目标跟踪,深度学习&SLAM,动态物体分割
展开
-
基于图像的动态物体估计
自动驾驶场景中刚体和非刚体运动处理1 D-RelNet: Joint Object and Relational Network for 3D Prediction https://github.com/nileshkulkarni/relative3d提出了一种预测场景中物体三维形状和姿态的方法。追求这一目标的现有基于学习的方法会对每个对象进行独立预测,而不会利用它们之间的关系。我们认为,对这些关系进行推理是至关重要的,并提出了一种将其纳入三维预测框架的方法。除了独立的单目标预测之外,我们还以相对原创 2020-05-12 21:34:52 · 1804 阅读 · 0 评论 -
深度CNN的火灾识别与定位
K. Muhammad, J. Ahmad, Z. Lv, P. Bellavista, P. Yang and S. W. Baik, “Efficient Deep CNN-Based Fire Detection and Localization in Video Surveillance Applications,” in IEEE Transactions on Systems, Man, and Cybernetics: Systems, vol. 49, no. 7, pp. 1419-143原创 2020-11-29 14:06:30 · 3111 阅读 · 0 评论 -
#每天一篇 端到端伪激光图像3D目标检测
End-to-End Pseudo-LiDAR for Image-Based 3D Object Detection摘要自主驾驶是安全、准确检测三维物体的必要条件。尽管激光雷达传感器可以提供精确的三维点云环境估计值,但在许多情况下,它们的成本也高得让人望而却步。最近,伪激光雷达(PL)的引入使得基于LiDAR传感器的方法与基于廉价立体相机的方法之间的精度差距大大缩小。PL通过将二维深度图输出转换为三维点云输入,将用于三维深度估计的最新深度神经网络与用于三维目标检测的深度神经网络相结合。然而,到目前为止原创 2020-10-23 01:03:40 · 1021 阅读 · 1 评论 -
每天一篇论文 Stereo Plane SLAM Based on Intersecting Lines
Stereo Plane SLAM Based on Intersecting Lines基于相交线的双目平面SLAM摘要平面特征是SLAM系统中减小漂移误差的一种稳定标志。从密集点云中提取平面是一种简单、快速的方法,常用于RGB-D相机或激光雷达。但是对于立体相机来说,密集点云的精确高效计算是一个难点。本文提出了一种从立体图像中提取相交线计算平面参数的新方法。平面特征普遍存在于人造物体和构筑物的表面,具有规则的形状和直线的线条。在三维空间中,两条相交的直线可以确定这样一个平面。因此,我们从立体左、右原创 2020-10-18 01:27:12 · 520 阅读 · 0 评论 -
每天一篇论文 373/1000 PSEUDO-LIDAR++:ACCURATE DEPTH FOR 3D OBJECT DETECTION IN AUTONOMOUS DRIVING
PSEUDO-LIDAR++:ACCURATE DEPTH FOR 3D OBJECT DETECTION IN AUTONOMOUS DRIVING本文了一种新的图形传(GCD)播算法,它集成了两种数据模式,并使用两个稀疏矩阵求解器来传播稀疏但精确的深度估计。得到的系统是准激光雷达++ (SDN + GDC),其性能几乎与64波束激光雷达系统相当,价格为7.5万美元,但只需要4波束和两个商用摄像机,总成本不到1000美元。摘要汽车、行人等物体的三维检测在自动驾驶中起着不可或缺的作用。现有的方法主原创 2020-05-09 18:36:21 · 2221 阅读 · 0 评论 -
每天一篇论文 370/1000 Consistent Video Depth Estimation
Consistent Video Depth Estimation本文的一个概念就是稠密深度估计=重建,从重建的角度来做深度估计。1.摘要提出了一种重建单目视频中所有像素密集、几何一致性深度估计算法。我们利用传统的structure-from-motion重建来建立视频像素的几何约束。与经典重建中的特殊先验不同,我们使用基于学习的先验,即训练卷积神经网络进行单图像深度估计。在测试时,我们对...原创 2020-05-05 02:00:49 · 2069 阅读 · 0 评论 -
每天一天论文 364/365 Memory-Efficient Implementation of DenseNets
Memory-Efficient Implementation of DenseNetsCode摘要由于特性重用,DenseNet体系结构[9]具有很高的计算效率。然而,一个简单的DenseNet实现可能需要大量的GPU内存:如果管理不当,预激活批处理规范化和连续卷积操作可以生成随网络深度二次增长的特征图。在本文中,我们介绍了在训练中减少DenseNets内存消耗的策略。通过策略性地使用共享...原创 2020-04-22 18:32:53 · 416 阅读 · 2 评论 -
每天一篇论文 363/365 Towards Better Generalization: Joint Depth-Pose Learning without PoseNet
Towards Better Generalization: Joint Depth-Pose Learning without PoseNetCode摘要**在这项工作中,我们解决了自监督联合深度-姿态学习中尺度不一致的本质问题。**现有的大多数方法都假设在所有输入样本上都能获得一致的深度和姿态,这使得学习问题更加困难,导致在室内环境中的性能下降和泛化能力有限,以及长序列视觉里程测量的应用...原创 2020-04-22 01:13:52 · 1021 阅读 · 0 评论 -
每天一篇论文 362/365 深度估计网络与SLAM结合
Towards Better Generalization: Joint Depth-Pose Learning without PoseNetVisual Odometry Revisited: What Should Be Learnt?Deep Virtual Stereo Odometry: Leveraging Deep Depth Prediction for Monocular ...原创 2020-04-21 02:06:11 · 396 阅读 · 0 评论 -
每天一篇论文 360/365 Robust Semi-Supervised Monocular Depth Estimation with Reprojected Distances
Robust Semi-Supervised Monocular Depth Estimation with Reprojected DistancesCode摘要基于单个图像的密集深度估计是计算机视觉中的一个关键问题,在许多机器人任务中有着令人兴奋的应用。最初被视为一个直接回归问题,需要在训练时使用带注释的标签作为监督,在过去几年中,在基于强几何线索的自监督深度训练方面做了大量的工作,无论...原创 2020-04-19 01:15:36 · 598 阅读 · 0 评论 -
每天一篇论文 357/365 Multi-Level Fusion based 3D Object Detection from Monocular Images
Multi-Level Fusion based 3D Object Detection from Monocular Images摘要本文提出了一种基于端到端多层次融合的单目图像三维目标检测框架。整个网络由两部分组成:一部分用于生成二维区域建议,另一部分用于同时预测对象的二维位置、方向、尺寸和三维位置。借助于一个独立的视差估计和三维点云计算模块,我们引入了多级融合方案。首先,对视差信息进行前...原创 2020-04-14 01:08:28 · 1172 阅读 · 0 评论 -
#每天一篇论文 355/365 Learning Independent Object Motion from Unlabelled Stereoscopic Videos
Learning Independent Object Motion from Unlabelled Stereoscopic VideosDepth prediction without the sensors: Leveraging structure for unsupervised learning from monocular videos.Unsupervised scale-co...原创 2020-04-07 09:48:25 · 268 阅读 · 0 评论 -
每天一篇论文 354/365 Deep Snake for Real-Time Instance Segmentation
Deep Snake for Real-Time Instance SegmentationCode摘要本文提出了一种基于轮廓的deep snake方法用于实例的实时分割。与最近一些直接从图像中回归对象边界点坐标的方法不同,deep snake使用神经网络迭代变形初始轮廓以匹配对象边界,这实现了snake算法的经典思想和基于学习的方法。对于轮廓的结构化特征学习,我们提出在deep snake...原创 2020-04-04 00:27:41 · 712 阅读 · 0 评论 -
每天一篇论文 353/365 Multimodal Semantic SLAM with Probabilistic Data Association
基于概率数据关联的多模态语义SLAM摘要近年来目标检测系统的成功推动了基于对象的机器人导航表示,即语义同步定位与映射(SLAM)。语义SLAM问题可以分解为一个离散的推理问题:确定对象类标签和测量地标对应关系(数据关联问题)和一个连续的推理问题:获取机器人在环境中的位置和姿态集合。语义SLAM问题的一个解决方案必然要解决这个联合推理问题,但在不明确的数据关联下,这通常是一个非高斯推理问题,而以...原创 2020-03-30 23:45:21 · 668 阅读 · 0 评论 -
每天一篇论文 351/365 An Automatic DNN Structured Pruning Framework for Ultra-High Compression Rates
AutoCompress: An Automatic DNN Structured Pruning Framework for Ultra-High Compression Rates摘要结构化权值剪枝是DNNs中一种具有代表性的模型压缩技术,它可以减少存储和计算需求,加快推理速度。由于柔性超参数的数量庞大,需要一个自动确定超参数的过程。本文提出了一种自动结构化剪枝框架AutoCompres...原创 2020-03-24 00:10:46 · 954 阅读 · 1 评论 -
每天一篇论文 350/365 MVP: Unified Motion and Visual Self-Supervised Learning for Large-Scale Robotic Navig
MVP: Unified Motion and Visual Self-Supervised Learning for Large-Scale Robotic Navigation核心;基于mvp的方法,使用在大型环境中收集的运动估计和视觉数据进行训练。MVP方法是通过将局部运动估计与紧凑的视觉表现联系起来,从而有效地训练我们的政策网络。利用这些数据,强化学习政策可以学会以一种自我监督的方式将运...原创 2020-03-21 23:51:18 · 311 阅读 · 0 评论 -
每天一篇论文 349/365 Custom hardware architectures for embedded high-performance and low-power SLAM(四)
Custom hardware architectures for embedded high-performance and low-power SLAM(一)Custom hardware architectures for embedded high-performance and low-power SLAM(二)Custom hardware architectures for em...原创 2020-03-20 19:22:07 · 304 阅读 · 0 评论 -
每天一篇论文 348/365 Custom hardware architectures for embedded high-performance and low-power SLAM(三)
Custom hardware architectures for embedded high-performance and low-power SLAM(一)Custom hardware architectures for embedded high-performance and low-power SLAM(二)Custom hardware architectures for em...原创 2020-03-20 00:50:11 · 225 阅读 · 0 评论 -
每天一篇论文 347/365 Custom hardware architectures for embedded high-performance and low-power SLAM(二)
Custom hardware architectures for embedded high-performance and low-power SLAM(一)A brief history of SLAM这节介绍了SLAM从最开始的SLAM的根源可以追溯到20世纪初,当时的分析方法是利用同一场景的多个视角(照片)来恢复其部分几何结构。知道最近SLAM的发展。Principles of s...原创 2020-03-19 00:53:16 · 172 阅读 · 0 评论 -
每天一篇论文 346/365 Domain Decluttering: Simplifying Images to Mitigate Synthetic-Real Domain Shift and
Domain Decluttering: Simplifying Images to Mitigate Synthetic-Real Domain Shift and Improve Depth EstimationCode核心思想是通过注意力网络将用来深度估计得真实图片合成训练图片,缩小两者之间的差距。深度估计误差类型摘要利用合成渲染数据提高单目深度估计的潜力很大,但缩小合成真实域的...原创 2020-03-17 00:31:12 · 516 阅读 · 0 评论 -
每天一篇论文 345/365 D3VO: Deep Depth, Deep Pose and Deep Uncertaintyfor Monocular Visual Odometry
D3VO: Deep Depth, Deep Pose and Deep Uncertaintyfor Monocular Visual Odometry参考What Uncertainties Do We Need in Bayesian Deep Learning for Computer Vision? 摘要我们提出了一个新的单目视觉里程测量框架D3V O,该框架在三个层次上利用深度...原创 2020-03-16 00:39:15 · 2024 阅读 · 1 评论 -
每天一篇论文 345/365Custom hardware architectures for embedded high-performance and low-power SLAM(一)
Custom hardware architectures for embedded high-performance and low-power SLAM(博士论文)嵌入式高性能低功耗SLAM的定制硬件体系结构第一章“有没有可能为嵌入式平台设计一种定制的硬件架构,这种架构可以将高性能的先进SLAM功能与低功耗特性结合起来,应该如何设计这样的架构?这一章作者对从稀疏到致密的连续介质。更...原创 2020-03-15 01:42:37 · 203 阅读 · 0 评论 -
每天一篇论文 343/365 Pyiredicting Sharp and Accurate Occlusion Boundaries in Monocular Depth Estimation
Predicting Sharp and Accurate Occlusion Boundaries in Monocular Depth Estimation Using Displacement Fields摘要现有的单目图像深度图预测方法倾向于预测输入图像中遮挡平滑边界、局部性差的轮廓。这是不幸的,因为遮挡边界是识别对象的重要线索,正如我们所展示的,提出从场景重建中发现新对象的方法。为了...原创 2020-03-13 01:06:10 · 537 阅读 · 0 评论 -
每天一篇论文342/365 Self-Supervised Deep Pose Corrections for Robust Visual Odometry
Self-Supervised Deep Pose Corrections for Robust Visual OdometryCode摘要提出了一种自监督的深度位姿校正(DPC)网络,该网络将位姿校正应用于视觉里程计估计器以提高其精度。我们没有直接回归帧间姿态变化,而是在先前工作的基础上,使用数据驱动的学习来回归姿态修正,该修正解释了由于违反建模假设而导致的系统误差。我们的自监督公式消除了...原创 2020-03-12 00:08:48 · 612 阅读 · 0 评论 -
#每天一篇论文 341/365 Learning Guided Convolutional Network for Dept Completion
Learning Guided Convolutional Network for Dept CompletionCode摘要稠密深度感知对于自动驾驶和其他机器人应用至关重要。然而,现代激光雷达传感器只能提供稀疏的深度测量。因此,有必要完成稀疏的激光雷达数据,其中经常使用同步制导RGB图像来促进这一完成。许多神经网络都是为这项任务而设计的。然而,它们通常通过执行特征拼接或元素级加法来融合Li...原创 2020-03-07 22:16:39 · 1435 阅读 · 1 评论 -
每天一篇论文呢 340/365 M3D-RPN: Monocular 3D Region Proposal Network for Object Detection
M3D-RPN: Monocular 3D Region Proposal Network for Object DetectionCodeDetNet: Design backbone for object detection摘要在三维环境中认识世界是城市自主驾驶的重要组成部分。一般来说,昂贵的激光雷达传感器和立体RGB成像的结合对于成功的3D目标检测算法来说是至关重要的,而单目图像方法...原创 2020-03-06 00:10:16 · 741 阅读 · 0 评论 -
每天一篇论文 339/365 Geometry meets semantics for semi-supervised monocular depth estimation
Geometry meets semantics for semi-supervised monocular depth estimation 摘要从单个图像进行深度估计是计算机视觉中一个非常激动人心的挑战。虽然其他基于图像的深度传感技术利用不同视点之间的几何结构(例如,来自运动的立体或结构),但是在单个图像中缺少这些线索会使单目深度估计任务变得不适定。为了便于推断,用于单目深度估计的最新编码...原创 2020-03-03 18:04:33 · 473 阅读 · 0 评论 -
每天一篇论文338/365 PAD-Net:多任务引导预测与精馏网络的同步深度估计和场景分析
PAD-Net: Multi-Tasks Guided Prediction-and-Distillation Network for Simultaneous Depth Estimation and Scene ParsingPAD-Net:多任务引导预测与精馏网络的同步深度估计和场景分析摘要深度估计和场景解析是视觉场景理解中两个特别重要的任务。本文针对联合CNN中的深度估计和场景解析问...原创 2020-03-02 00:58:48 · 1833 阅读 · 0 评论 -
每天一篇论文 337/365 How Does Batch Normalization Help Optimization?
How Does Batch Normalization Help Optimization?(NIPSNeurIPS 2018)摘要批处理规范化(BatchNorm)是一种广泛采用的技术,它使深层神经网络(DNNs)的快速稳定训练。尽管BatchNorm的广泛应用,但其有效性的确切原因仍不清楚。人们普遍认为,这种有效性来源于控制训练过程中各层输入分布的变化,以减少所谓的“内部协变量转移”。在...原创 2020-02-29 00:18:49 · 340 阅读 · 0 评论 -
每天一篇论文 335/365 Modelling Generalized Forces with Reinforcement Learning for Sim-to-Real Transfer
Modelling Generalized Forces with Reinforcement Learning for Sim-to-Real Transfer本文是一篇如何通过对强化学习的环境模型力ide约束来优化强化学习对于从仿真训练到真实模型的差距。摘要在现实世界中学习机器人控制策略在数据效率、安全性和控制系统初始状态方面都带来了挑战。另一方面,模拟是一种有用的替代方法,因为它们提供...原创 2020-02-25 23:28:53 · 692 阅读 · 0 评论 -
每天一篇论文 334/365 Don’t Forget The Past: Recurrent Depth Estimation from Monocular Video
Don’t Forget The Past: Recurrent Depth Estimation from Monocular VideoCode作者唠了半天就是给encode前加了ConvLSM,让特征在时间上能有联系,说是提高了Depth估计准确度,起的名字能逗死你,别忘记曾经:单目视频序列循环深度估计摘要自动驾驶汽车需要不断更新的深度信息,目前为止,即使该方法是从视频输入开始的,也...原创 2020-02-24 00:34:14 · 619 阅读 · 2 评论 -
每天一篇论文 333/365 Multi-object Monocular SLAM for Dynamic Environments
Multi-object Monocular SLAM for Dynamic Environments摘要动态环境下的多体单目SLAM在感知和状态估计方面仍然是一个长期的挑战。尽管存在理论上的解决方案,但实践却滞后,主要原因是缺乏动态参与者的稳健感知和预测模型。动态场景中的多体单目SLAM的典型挑战源于不可观测性问题,因为不可能从移动的单目摄像机中三角化运动对象。在物体运动的限制下,这个问题...原创 2020-02-22 23:10:21 · 701 阅读 · 0 评论 -
每天一篇论文 332/365 Visual Semantic SLAM with Landmarks for Large-Scale Outdoor Environment
Visual Semantic SLAM with Landmarks for Large-Scale Outdoor Environment[Code](摘要-语义SLAM是自主驾驶和智能代理中的一个重要领域,它能使机器人实现高层次的导航任务,获得简单的认知或推理能力,实现基于语言的人机交互。本文将ORB-SLAM[1]、[2]的三维点云与PSPNet-101[3]卷积神经网络模型的语义分...原创 2020-02-22 01:31:51 · 934 阅读 · 1 评论 -
每天一篇论文 330/365 Survey of Model-Based Reinforcement Learning:Applications on Robotics(补1)
Survey of Model-Based Reinforcement Learning:Applications on Robotics这是一篇17年机器人基于模型的强化学习综述,作者对强化学习的各个部分发展,并在各种机器人的应用做了介绍,本文适合对于强化学习模型改进能有一些帮助。摘要强化学习是一种吸引机器人学习新任务的方法。相关文献揭示了大量的方法,但同时也清楚地表明了在处理现实生活中的...原创 2020-02-20 00:16:10 · 438 阅读 · 0 评论 -
#每天一篇论文 329/365 EyrISV2:一种用于移动设备上深度神经网络的柔性加速器(一)
Eyeriss v2: A Flexible Accelerator for Emerging Deep Neural Networks on Mobile Devices摘要深度神经网络(deep neural network,DNN)发展的一个最新趋势是将深度学习应用扩展到资源和能量更为受限的平台,例如移动设备。这些努力旨在减小DNN模型的尺寸,提高硬件处理效率,并使DNN具有更紧凑的结...原创 2020-02-16 00:36:01 · 952 阅读 · 0 评论 -
/每天一篇论文328/365 Learning Residual Flow as Dynamic Motion from Stereo Videos
[Learning Residual Flow as Dynamic Motion from Stereo Videos](https://arxiv.org/pdf/1909.06999.pdf)摘要提出了一种将运动立体平台上的三维场景流分解为静止场景元素和动态对象运动的方法。我们的无监督学习框架共同考虑了摄像机运动、光流和运动物体的三维运动。三个协同网络分别预测立体匹配、相机运动和偏差流...原创 2020-02-14 00:20:25 · 423 阅读 · 0 评论 -
每天一篇论文 327/365 Instance-wise Depth and Motion Learning from Monocular Videos
Instance-wise Depth and Motion Learning from Monocular Videos摘要我们提出了一个端到端的联合训练框架,在没有监督的情况下,直接模拟了多个动态物体的6自由度运动、Ego-motion和深度。在我们的框架中使用的唯一注释是一个视频实例分割图,它可以由我们新的自动注释方案进行预测。我们的贡献主要三个方面。首先,我们提出了一个可微的前向刚性...原创 2020-02-12 00:47:41 · 978 阅读 · 0 评论 -
每天一篇论文 326/365 SDNet: Semantically Guided Depth Estimation Network
SDNet: Semantically Guided Depth Estimation Network摘要自主车辆和机器人需要对环境有全面的了解才能与之互动。这种感知通常结合了像素级的深度知识和来自视频传感器的每个图像的语义标签。最近基于学习的方法使用两个独立的cnn独立地估计这两种类型的信息。本文提出了一个能同时预测两个输出的模型,与深度和语义的独立估计相比,该模型能提高结果,甚至降低计算成...原创 2020-02-09 23:28:18 · 669 阅读 · 0 评论 -
每天一篇论文 324/365RTM3D: Real-time Monocular 3D Detection from Object Keypoints for Autonomous Driving
转自:https://mp.weixin.qq.com/s/wkkWzjm8o5QH5KwNmFO7xA##作者来自泡泡机器人图灵智库李培玄摘要我们提出了一种高效和准确的单目三维检测方法。大多数基于图像的三维检测方法都将3DBBox到2DBBox的几何约束当作其重要的组件,然而四条边仅能提供四个几何约束,这使得2DBBox有微小误差时也会造成3D检测性能的急剧下降。与这些方法不同我们将三维检...原创 2020-02-08 23:54:49 · 1729 阅读 · 2 评论 -
每天一篇论文(323/365)EGNet: Edge Guidance Network for Salient Object Detection
EGNet: Edge Guidance Network for Salient Object Detectioncode摘要全卷积神经网络(FCNs)在突出目标检测任务中显示出其优越性。然而,大多数现有的基于FCNS的方法仍然遭受粗对象边界。为了解决这一问题,本文重点研究了显著边缘信息和显著目标信息之间的互补性。因此,我们提出了一种用于显著目标检测的边缘引导网络(EGNet),该网络分三...原创 2020-02-08 01:04:01 · 701 阅读 · 0 评论