![](https://img-blog.csdnimg.cn/aa98e5f7452541a88eccc8655c9736df.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
论文学习
文章平均质量分 89
学习过的一些论文
可乐大牛
上海某高校在读cs研究生,希望早点发出论文,考公考编 哈哈哈哈
展开
-
【3D目标检测】Is Pseudo-Lidar needed for Monocular 3D Object detection?
如何引入获得空间信息如何增强深度估计效果密集深度估计子网络大规模数据集下的深度估计预训练。原创 2023-03-12 21:34:36 · 802 阅读 · 2 评论 -
【3D目标检测】WEAKM3D: TOWARDS WEAKLY SUPERVISEDMONOCULAR 3D OBJECT DETECTION
核心问题:如何以2D检测框对应的目标点云作为监督信号进行弱监督学习,训练一个单目3D目标检测网络如何最小化预测的3D边界框与目标点云之间的几何距离如何缓解几何对齐带来的对齐模糊问题。对齐模糊问题指的是有些目标通过激光雷达只能获取它一个表面的点,不知道该通过3D边界框的哪个表面去和他对齐点云分布不均匀,稀疏点但是重要的点应该比稠密的点产生更大的损失为了得到3D边界框,预测大量的参数,并且这些参数相互耦合,如位置、尺寸、偏航角。原创 2023-02-23 23:32:51 · 707 阅读 · 0 评论 -
【3D目标检测】Boosting Monocular 3D Object Detection with Object-Centric Auxiliary Depth Supervision
本文是基于单目图像的3D目标检测方法。研究的问题:object-centric auxiliary depth loss,并且使用原始点云而非标注作为监督信号(旨在减少深度误差,尤其是前景区域的深度误差)(更改了深度回归的目标)引入了目标深度分解以及深度不确定性,前者指的是更改了深度回归的目标,后者指的是输出深度分布而非深度值,考虑到了定位的不确定性。原创 2023-02-16 23:26:55 · 516 阅读 · 2 评论 -
【3D目标检测】Pseudo-Stereo for Monocular 3D Object Detection in Autonomous Driving
本文是基于单目图像的3D目标检测方法。能否借助立体图像检测算法提高单目图像检测的效果如何实现右侧图像的生成受启发于伪点云,提出了伪立体图像的概念,将图像转换成立体图像,然后应用立体图像的检测算法提出两种右侧图像生成的方法,分别是图像级别生成和特征级别生成(基于视差的动态卷积方法)提出一个观点:学习深度感知的特征有利于提高单目检测的性能,比如作者这边的深度估计以及深度损失。原创 2023-02-14 23:04:18 · 981 阅读 · 0 评论 -
【3D目标检测】基于伪雷达点云的单目3D目标检测方法研宄
本文是基于单目图像的3D目标检测方法,是西安电子科技大学的郭鑫宇学长的硕士学位论文。【2021】【单目图像的3D目标检测方法】原创 2023-02-10 14:03:41 · 1421 阅读 · 1 评论 -
【3D目标检测】Delving into Localization Errors for Monocular 3D Object Detection
本文是基于单目图像的3D目标检测方法。核心问题:如何提高基于单目图像的3D目标检测的效果。作者量化了每个子任务的整体影响,观察到以下现象观察一:定位误差是制约目标检测性能的关键因素,当然还有深度估计以及3D中心的2D投影。观察二:随着深度的增加,检测性能显著下降(对于很近的物体,性能也很差),甚至超过一定距离几乎不可能准确检测。我们将这些几乎无法准确检测的远距离样本称为坏样本,这些样本会降低模型对于易于检测样本的表示,危害整体性能观察三:尺寸估计也是制约目标检测性能的重要因素。原创 2023-01-11 21:52:09 · 786 阅读 · 0 评论 -
【3D目标检测】SMOKE: Single-Stage Monocular 3D Object Detection via Keypoint Estimation
本文是基于单目图像的3D目标检测方法。以往的3D目标检测方法中都会有一个子网络,通过2D目标检测产生2D候选框,然后通过2D候选框去学习3D信息或者得到伪点云送入基于点云的网络中。而这种基于2D目标检测的方法会存在一些问题,如冗余。因为3D信息+内参矩阵可以直接拿到2D信息。引入噪声。添加了2D目标检测子网络之后,整个流程就分阶段了,前一阶段会引入持续的噪声,导致后一阶段学习3D特征变得困难。而为了解决这个问题,又有了很多的研究,但不管怎么说,多阶段的方法都会导致性能的降低。原创 2022-12-28 22:05:56 · 836 阅读 · 0 评论 -
【目标检测】Objects as Points
本文是一个anchor-free的目标检测算法。如何更好地将目标检测问题建模为关键点检测问题一个简单高效的目标检测方法CenterNet。简单:彻底的端到端(不需要NMS后处理),整体流程就是关键点预测+相关参数回归,高效:不需要预先设置anchor,速度精度都超过了基于anchor的方法。原创 2022-12-23 22:38:29 · 582 阅读 · 0 评论 -
【3D目标检测】Orthographic Feature Transform for Monocular 3D Object Detection
本文是基于单目图像的3D目标检测方法。在图像表示中,物体的比例会随着深度的变化而变化;物体的外观随着视点的不同而不同;物体的距离(无论是物体相对于坐标系的绝对距离还是物体之间的相对距离)无法直接表示,且后者是没有意义的,会随着深度的变化而变化的。作者认为应该在3D空间中进行检测,因此提出了一种可微的正交特征变换方式,将图像特征变换成正交的鸟瞰图特征,这种表示下物体的比例是均匀的,外观是与视点无关的,距离是有意义的。原创 2022-12-20 22:33:01 · 757 阅读 · 0 评论 -
【3D目标检测】Categorical Depth Distribution Network for Monocular 3D Object Detection
本文是基于单目图像的3D目标检测方法。以往的深度信息学习方法(无论是显示学习还是隐式学习)都存在一些问题,会导致后面边界框定位困难以往基于基于深度的方法将深度估计和目标检测分开训练以往基于网格的方法生成的鸟瞰图表示质量不高为每个像素预测一组深度分布,能够得到高质量的鸟瞰图,使得边界框定位更加准确实现了端到端的训练,也就是单个网络中同时进行深度估计和目标检测没有中间表示的方法,也就是基于2D特征+各种约束实现检测,如2D-3D约束,关键点约束等。没有显示的使用深度信息,定位性能相对较差。原创 2022-12-15 22:32:34 · 875 阅读 · 0 评论 -
【3D目标检测】Disp R-CNN: Stereo 3D Object Detection via Shape Prior Guided Instance Disparity Estimation
本文是基于双目图像的3D目标检测方法。(双目方法所以看的不太仔细)以往的工作估计整张视差图,计算量大且无法使用类别具体的先验信息训练中视差标注不足提出一个实例级别的视差估计网络,只在ROI上进行视差估计使用统计形状模型而非激光雷达生成密集的视差标注。原创 2022-12-12 14:53:19 · 479 阅读 · 0 评论 -
【3D目标检测】Accurate Monocular Object Detection via Color-Embedded 3D Reconstruction for AD
本文是基于图像的3D目标检测方法。感觉上和伪点云原论文没什么不同,只是说基于伪点云的方法将深度图转换成伪点云之后直接使用了已有的工作,而作者自己设计了一个流程,这个流程中将颜色信息嵌入到了伪点云中。主要分为两个阶段,3D数据生成以及3D边界框预测原创 2022-12-07 23:23:22 · 842 阅读 · 0 评论 -
【3D目标检测】学习过的论文整理
本文将我所学习过的3D目标检测论文按照自己的理解进行分类,并介绍每篇论文研究的问题与采用的方法,格式如下:【年份】【模型简写】【论文名称】【笔记链接】问题1问题2方法1方法2。原创 2022-12-03 16:57:44 · 1751 阅读 · 0 评论 -
【3D目标检测】Rethinking Pseudo-LiDAR Representation
本文是基于图像的3D目标检测算法。作者认为基于伪点云的3D目标检测算法效果好的原因并不是伪点云这种数据表示本身,而是坐标系的转换。对于深度图,作者采用图像表示而不是伪点云的表示,之后采用2D CNN处理,成为了新的SOTA伪点云(【3D目标检测】Monocular 3D Object Detection with Pseudo-LiDAR Point Cloud)原创 2022-12-02 23:17:45 · 938 阅读 · 0 评论 -
【3D目标检测】PSEUDO-LIDAR++: ACCURATE DEPTH FOR 3D OBJECT DETECTION INAUTONOMOUS DRIVING
本文是基于图像的3D目标检测算法。就像是之前中提到的,伪点云中还是存在很多问题的(比如伪点云与真实点云的局部不对齐),但是这些问题都可以归结到深度估计的效果不好上,因此作者聚焦如何提高深度估计的效果,尤其是对远处物体的深度估计。这里红色部分就是基于视差得到的点云,相对于绿色的真实边界框存在一部分的偏移,粉红色的是作者提出的双目深度估计算法得到的点云,相比之下稍微好了点,再结合黄色的稀疏激光雷达信号指引下的深度传播方法,就得到了蓝色的点云,可以发现此时视差点全部都在真实边界框当中了,可以说消除了偏差。原创 2022-12-01 00:00:09 · 925 阅读 · 0 评论 -
【3D目标检测】双目3D视觉原理
两台相机一左一右对统一目标进行拍摄(相机的高度相同),得到两张图像,这两张图像只有左右偏移,我们可以根据这个偏移得到深度信息(目标距离相机的远近)。那么关键就变成了找到两张图片中的匹配关系,只要有了匹配关系就能得到视差,基于视差就能用上面的公式计算深度了。采用上面的算法得到视差图,使用视差图得到深度图,基于深度图转换成点云。背后的原理是:距离越远,左右偏移越大,距离越近,左右偏移越小。下面是某一个视差计算的算法。原创 2022-11-23 12:18:15 · 1548 阅读 · 0 评论 -
【3D目标检测】单目相机成像原理
为了方便对透镜模型进一步简化,得到小孔成像的模型。小孔成像模型中,所成的像和原像之间的对应关系,全部都是连线,或者说所有的光线都没有改变方向。为了后面的分析方便,对小孔成像的模型进行进一步的调整,将成像平面画到镜头的对称位置,使得图像不再倒立。相机结构最基本的理解就是透镜模型,穿过光心的光线没有改变方向,其他光线都会在一定程度上改变方向。红色部分可以预处理出来,只要拿到深度,就可以快速得到对应的空间坐标。这里的x,y是物理坐标,不是图像当中的像素坐标。z是深度,就是物体距离相机的距离。原创 2022-11-22 23:21:07 · 2807 阅读 · 0 评论 -
【3D目标检测】Monocular 3D Object Detection with Pseudo-LiDAR Point Cloud
本文的输入数据仅仅是单目图像,在方法上是融合了伪点云(Pseudo-LiDAR)的深度信息表示方法与Frustum PointNets的检测方法。乍一看文章和伪点云原论文一模一样,但是会更具体一点,也就是本文只关注单目图像,同时解决了一些伪点云存在的问题。作者提到了其他设备的一些弊端:深度相机能捕捉的范围很有限;双目相机工作的流程很麻烦,需要校准与同步;激光雷达就不用说了,很贵 哈哈哈哈哈。相比之下,单目相机既便宜又方便安装,能捕捉的范围也大,核心问题就是没有深度信息。原创 2022-11-22 20:34:17 · 1413 阅读 · 0 评论 -
【3D目标检测】Frustum PointNets for 3D Object Detection from RGB-D Data
首先本文是基于图像和点云的,属于早期的模态融合的成果,是串行的算法,而非并行的,更多的是如何根据图像和点云进行3D目标检测的思考。以往基于点云的算法,要么是将点云进行编码成规则结构如体素、体柱,然后进行处理,要么是将点云转换成鸟瞰图,然后进行处理。当然也有一些工作比如PointNet类的算法,但是它们能进行分类和分割,并没有进行目标检测。原创 2022-11-16 12:26:14 · 1627 阅读 · 0 评论 -
【3D目标检测】Pseudo-LiDAR from Visual Depth Estimation
本文是基于图像的3D目标检测算法,以往基于图像的方法在精度上始终远远低于基于点云的方法,其中的原因一般被认为是基于图像的深度估计效果不好,而作者认为是数据表示的问题,作者将预测到的深度图转换成了伪点云,然后应用基于点云的算法,得到了远超普通基于图像方法的效果。(当时30m范围内,基于图像方法的SOTA是22%的准确率,本文达到了74%)以往基于图像的方法,最主要的工作就是模态融合,辅助基于点云的方法得到更好的效果 害!原创 2022-11-09 22:50:26 · 883 阅读 · 0 评论 -
【3D目标检测】3D Object Detection from Images for Autonomous Driving: A Survey
这是一篇22年的综述,介绍了3D目标检测中基于图像的检测算法。(论文中说本文是第一篇基于图像的3D目标检测算法综述!)原创 2022-11-07 22:27:52 · 1512 阅读 · 0 评论 -
【3D目标检测】KITTI数据集介绍
KITTI数据集很大,包括了很多任务,使用的训练样本7481个,测试样本7518个OpenPCDet——环境配置和训练测试(升级系统、Nvidia驱动、cuda11.3、cudnn8.2)【KITTI】KITTI数据集简介(一) — 激光雷达数据。原创 2022-11-05 16:56:51 · 9884 阅读 · 1 评论 -
【3D目标检测】PointPillars: Fast Encoders for Object Detection from Point Clouds
首先,本文是基于点云,但不是将点云处理成体素,而是体柱!比较主流的一种方式就是将点云编码成体素,但是这就使得后面需要使用3D卷积进行特征提取,开销比较大(哪怕SECOND中引入了稀疏卷积,计算量还是比2D卷积大);另外一种思路就是从俯视角度将点云数据进行处理,得到伪图片的数据,之后使用2D卷积处理,开销小了,但是得到伪图片的过程中,丢失了很多信息。因此作者在一定程度上融合了这两种方法的思想,提出了一种新的点云编码方式,在这种方式下,仅仅使用2D卷积就可以实现端到端的3D目标检测。原创 2022-11-02 22:21:06 · 632 阅读 · 0 评论 -
【3D目标检测】SECOND: Sparsely Embedded Convolutional Detection
首先,本文是基于点云,并且将点云处理成体素的3D目标检测网络,提出的SECOND可以看做是VoxelNet的升级版。提出动机与贡献VoxelNet计算量比较大,速度比较慢(训练和推理),作者引入稀疏卷积代替朴素的3D卷积VoxelNet中,当预测bbox的偏航角与gt box的偏航角差异为π\piπ的时候,损失会比较大,但是这个bbox其实与真实的边界框已经很相似了。因为作者对于偏航角使用了一个新的损失函数,并且设计了一个方向分类器。提出了一种新的数据增广方式。原创 2022-10-26 19:02:47 · 1380 阅读 · 0 评论 -
【3D目标检测】3D Object Detection for Autonomous Driving: A Survey
这是一篇21年的综述,介绍了3D目标检测背景、传感器以及基于传感器的算法分类及其特点。原创 2022-10-22 22:17:48 · 2286 阅读 · 0 评论 -
【脑肿瘤分割】Brain Tumor Segmentation and Radiomics Survival Prediction: Contribution to the BRATS 2017 Ch
这篇文章相对而言会比较简单一点,就是使用了一个修改了的3D UNet做脑肿瘤分割任任务。原创 2022-10-19 23:12:27 · 1017 阅读 · 0 评论 -
【脑肿瘤分割】Deep learning based brain tumor segmentation: a survey
这是一篇22年的脑肿瘤分割的综述,作者在文中简单阐述了基于深度学习方法的发展过程,并把当前的方法大致分为三类,分别是具有有效架构的方法、处理不平衡状态的方法和利用多模态信息的方法。原创 2022-10-16 21:40:19 · 1430 阅读 · 0 评论 -
【3D目标检测】PDV(Point Density-Aware Voxels for LiDAR 3D Object Detection)
首先,本文是基于点云,并且将点云处理成体素的3D目标检测网络。Voxel Point Centroid Localization(体素点质心定位)就是使用非空体素中点计算体素的质心,然后结合质心点的特征得到包含细粒度位置信息的点密度分布,并使用它来实现候选框的回归,从而避免采样点云。原创 2022-10-12 19:39:54 · 1854 阅读 · 1 评论 -
【3D目标检测】PV-RCNN
首先,本文是基于点云,并且将点云处理成体素的3D目标检测网络。PV-RCNN融合了点云特征提取中基于体素方法和基于点方法的思想,进一步提高检测的性能提出了一种voxel-to-keypoint的编码方法,该方法将一帧内的多尺度体素特征编码为一系列的关键点中。这些关键点不仅保留了准确的位置信息,还拥有丰富的全局信息,可以提高三维检测性能。提出了一种在proposal中使用的多尺度的RoI特征提取层。该层可以通过多个感受野提取丰富的上文信息,用于优化预测框和置信度评分。原创 2022-10-11 17:03:47 · 1089 阅读 · 0 评论 -
【3D目标检测】VoxelNet: End-to-End Learning for Point Cloud Based 3D Object Detection
首先,本文是基于点云,并且将点云处理成体素的3D目标检测网络。本文提出了一种基于体素的特征提取方法,将点云中点的信息与体素代表的局部信息融合,最终得到更具有表征能力的特征,该特征经过3D卷积用于RPN网络中得到目标检测的结果。原创 2022-10-09 22:58:38 · 1053 阅读 · 1 评论 -
【3D目标检测】PointNet++
首先,本文是基于点云,并且直接处理点云数据的3D目标检测网络本文可以看做是对PointNet的一个改进。PointNet我们之前也聊到了。他最初是提取点的特征,然后通过对称函数(max pool)将所有的点特征进行聚合,得到全局点云特征,这就完成了特征提取部分的功能。但是在这个过程中,没有考虑到某些点与周围点之间的关系,没有提取局部的特征,这一点在CNN中大放异彩,因此也就限制了它的细粒度识别能力和泛化能力。原创 2022-10-09 10:59:48 · 947 阅读 · 0 评论 -
【3D目标检测】PointNet
首先,本文是基于点云,并且直接处理点云数据的3D目标检测网络本文提出了一个简单的网络,考虑点云的特性,直接处理点云数据,用于分类或者分割等任务。原创 2022-10-08 15:27:47 · 710 阅读 · 0 评论 -
【论文写作】相关内容
这篇文章主要想记录一下关于论文写作中创新点这部分的内容,主要包括我看到的、听到的还有自己发现的。原创 2022-10-07 22:34:57 · 180 阅读 · 0 评论 -
【网络结构】GoogLeNet-Incepetion 系列
作者想要实现在不增加过多的计算资源的同时,增加网络的深度和宽度,而要实现它,核心就是将全连接甚至一般的卷积都转化为稀疏连接。前者可以使用全局平均池化处理(不仅可以减少参数,还有利于迁移学习),但是对于后者而言,很困难。因为大部分的硬件都是对密集矩阵进行加速的,稀疏矩阵很难加速,所以作者提出了Incepetion 结构,构建密集的块结构来近似最优的稀疏结构(原理是相关研究表明将稀疏矩阵聚类为较为密集的子矩阵可以提高计算性能,这里反用了一下)。原创 2022-09-26 21:55:32 · 498 阅读 · 0 评论 -
【训练方法】OHEM
目标检测任务重存在严重的正负样本不均衡问题,以往的解决方法是困难负样本挖掘方法(HEM),但是它不太适合端到端的网络训练,所以本文提出了一种在线的困难负样本挖掘方法(OHEM),用于Fast RCNN这一类的基于候选框的目标检测模型。关于Fast RCNN。原创 2022-09-25 20:27:13 · 508 阅读 · 0 评论 -
【注意力机制】CBAM: Convolutional Block Attention Module
本文提出了一个注意力模块,融合和空间注意力和通道注意力,轻量并且具有通用性。原创 2022-09-25 10:50:22 · 810 阅读 · 0 评论 -
【目标检测】Faster RCNN
Fast RCNN几乎已经是端到端的模型了,并且相较于RCNN速度上有了很大的提升,但是距离实时的检测还有一定距离,当前速度的瓶颈来自于候选框的生成,因为他是跑在CPU上的。所以本文就提出了一个Region Proposal Network(RPN),用网络生成候选框,并且与检测器的特征提取网络共享特征。另一方面,引入了anchor机制,解决多尺度检测的问题。原创 2022-09-21 23:08:22 · 924 阅读 · 0 评论 -
【目标检测】Fast R-CNN
Fast R-CNN是对R-CNN和SPP-Net的改进,一方面借助SPP的思想,使得骨干网络只需要对原图做一次特征提取就好了,大大减少时间开销;另一方面将bbox的回归器和分类器都整合到了网络当中,方便了训练流程,也减少了特征存储的开销;还有一方面就是采用了新的训练策略,解决了SPP-Net中难以更新SPP模块之前的卷积层参数的问题。原创 2022-09-19 21:58:01 · 1169 阅读 · 0 评论 -
【目标检测】SPP-Net
过往的基于CNN的网络都会通过裁剪的缩放将输入图片的尺寸固定,这样的话其实是会降低模型对于任意大小和任意比例图片的检测能力的,前者可能无法完全包含目标。那么为什么网络会需要固定尺寸的输入呢?主要是由于全连接层的特性决定的。因为卷积可以看做是滑窗的形式,而池化可以看做是一种卷积的特例,对于他们而言任意的输入都可以得到对应的输出。全连接层就不一样了,输入和输出的神经元个数是固定的,那么它前一层输出的特征图就应该是固定尺寸的。原创 2022-09-18 11:16:01 · 1238 阅读 · 0 评论 -
【目标检测】R-CNN
R-CNN是将CNN用于目标检测领域的开山之作(虽然不一定是最早的,但确实最早出现好效果的),也是两阶段目标检测技术的开山之作,是后面一个系列的第一篇文章。原创 2022-09-15 23:38:43 · 455 阅读 · 0 评论