自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(160)
  • 收藏
  • 关注

原创 基于移动最小二乘法的曲线曲面拟合论文阅读笔记

基于移动最小二乘法得曲线曲面拟合论文阅读笔记

2023-01-09 15:23:12 2262 2

原创 Automatic extrinsic calibration between a camera and a 3D Lidar using 3D point and plane corresponde

Automatic extrinsic calibration between a camera and a 3D Lidar using 3D point and plane corresponde 论文阅读笔记

2022-12-27 12:01:22 1018

原创 Lift Splat Shoot Encoding Images from Arbitrary Camera Rigs by Implicitly Unprojecting to 3D 论文阅读笔记

Lift Splat Shoot Encoding Images from Arbitrary Camera Rigs by Implicitly Unprojecting to 3D 论文阅读笔记

2022-12-15 15:18:11 786 1

原创 边界外推和边界处理--cv::copyMakeBorder()和cv::borderInterpolate()

边界外推

2022-09-09 16:19:06 1364

原创 中值滤波器 median filter

中值滤波器

2022-09-03 15:51:13 8792 1

原创 Wing Loss 论文阅读笔记

wing loss 损失函数笔记

2022-09-03 00:16:30 1325

原创 深度学习中的常用的归一化方法汇总

深度学习中归一化的方法汇总

2022-08-30 16:33:26 3603

原创 常用激活函数汇总

激活函数汇总

2022-08-26 23:36:16 1095

原创 An Improved One millisecond Mobile Backbone 论文笔记

An Improved One millisecond Mobile Backbone 论文笔记

2022-07-12 22:51:19 675

原创 NormalEstimation法向量估计理论和代码---PCL源码笔记

NormalEstimation法向量估计理论和代码---PCL源码笔记

2022-07-12 10:48:52 2191

原创 RANSAC平面拟合理论和代码---PCL源码笔记

RANSAC平面拟合理论和相关PCL源码学习笔记

2022-07-07 21:35:36 4603 2

原创 # LeetCode 1046. 最后一块石头的重量---std::priority_queue优先队列

# LeetCode 1046. 最后一块石头的重量---std::priority_queue优先队列

2022-07-05 22:40:51 152

原创 LeetCode 1189. “气球” 的最大数量---unordered_map和字符串计数

”气球“的最大数量

2022-07-04 20:04:35 1487

原创 LeetCode 58. 最后一个单词的长度

最后一个单词的长度

2022-07-03 19:50:34 172

原创 LeetCode 35. 搜索插入位置 —vector遍历(O(logn)和O(n)的写法---二分查找法)

搜索插入位置 vector遍历

2022-07-03 19:39:33 1480 1

原创 LeetCode 1184. 公交站间的距离 ---vector顺逆时针

Leetcode 1184题目,vector索引,分成两部分。

2022-07-03 17:27:34 165

原创 TopFormer: Token Pyramid Transformer for Mobile Semantic Segmentation 论文笔记

TopFormer: Token Pyramid Transformer for Mobile Semantic Segmentation论文链接: https://arxiv.org/abs/2204.05525一、 Problem Statement是否能够设计出一个mobile-friendly Vision-Transformer的网络,能够比mobileNets有更低的延迟性,但能有更好的性能。二、 Direction结合MobileNet和vision transformer。三、

2022-04-23 17:28:17 3693

原创 In Defense of Classical Image Processing: Fast Depth Completion on the CPU 论文笔记

In Defense of Classical Image Processing: Fast Depth Completion on the CPU论文链接: https://arxiv.org/abs/1802.00036代码地址: https://github.com/kujason/ip_basic一、 Problem Statement如果将目前的激光雷达传感器数据投影到图像上的话,只能获得稀疏的深度图。这样会限制依赖于深度图的算法,比如3D目标检测等等。但深度补全的算法目前大部分都依赖于深

2022-03-08 21:54:23 4982 1

原创 多传感器融合课程笔记------信息融合

多传感器融合之信息融合一、多传感器融合的优点冗余性:多个传感器数据对目标的描述表示是相同的(如激光雷达检测的目标信息和摄像头目标信息大体一致,允许有一定的属性误差);互补性:由于每个传感器的探测范围和探测属性不同,传感器之间的目标属性可以相互补充( 如前方障碍物的颜色信息, 激光雷达识别不出来);合作性:不同传感器在处理信息时会对其他信息有所依赖(如相机在建立位姿关系时,需要依赖IMU的数据);信息分层:可以根据数据融合所呈现的位置,进行分层,包括原始数据层(简称像元层)、特征层、 决策层(也叫

2022-02-24 22:57:00 1667

原创 多传感器融合课程笔记------多传感器融合之绪论

多传感器融合之绪论一、传感器类型摄像头激光雷达毫米波雷达超声波雷达IMUGNSS和RTK1. 摄像头摄像头根据安装位置,可以分为前视、侧视、后视、内置、环视等。摄像头相关参数介绍:焦距焦距和FOV关系相反。有效的探测距离视场角分辨率大小最低照度信噪比动态范围2. 激光雷达激光雷达参数:视场角分辨率测距范围刷新频率扫描频率激光波长:通常为纳米级,最常见为905nm和1550nm。最大辐射功率激光雷达的测距有两种,一种是基于时间的测量方法,

2022-02-24 21:56:08 2013 4

原创 SMOKE: Single-Stage Monocular 3D Object Detection via Keypoint Estimation 论文笔记

SMOKE: Single-Stage Monocular 3D Object Detection via Keypoint Estimation 论文笔记论文链接: https://arxiv.org/abs/2002.10111一、 Problem Statement目前的单目3D视觉中,通常非常依赖于RCNN网络或者RPN网络,然后会多加一个分支去学习3D信息或者产生伪激光雷达,然后将它们放入点云检测网络中。作者认为2D检测网络是冗余的,且对3D目标检测来说引入了不可忽视的噪声,导致学习3D几

2022-02-22 23:24:36 2423

原创 A ConvNet for the 2020s 论文笔记

A ConvNet for the 2020s论文链接: https://arxiv.org/abs/2201.03545一、 Problem Statement现在Transformer大行其道,很多纯卷积的网络也不断的革新。这篇文章分析transformer的优势,也借鉴了一些新的卷积网络的点,基于ResNet50和ResNet200逐步提升精度。二、 Direction作者认为,Transformer的优势在于其multi-head self-attention中优异的scaling beh

2022-01-17 23:22:26 5113

原创 DataAnnotation

KITTI格式的3D目标框标注在得到图像数据,激光雷达数据,标定数据之后,需要进行3D目标框标注。本文采用的标注工具采用的是:SUSTechPOINTS。这个工具是2020年IEEE收录的,是一个比较好的开源项目,可以使得激光雷达和图像数据联合标注,感谢这个工作的贡献者。标注分为下列两个步骤:安装SUSTechPOINTS导入数据标注结果一、安装SUSTechPOINTS根据官方安装方式即可。二、导入数据这个部分强调的是calibration这个文件。我们从autoware标定得到的结

2022-01-11 21:53:35 6171 9

原创 DataCollection

KITTI采集数据此前我们已经安装了相关的相机驱动,且我们的海康工业相机采用USB3.0接口,但是直接用opencv读取不了数据,但是又由于购买的时候没有ROS驱动。因此通过官网所提供的示例,修改为通过ROS发布图像数据话题。分为下面三个步骤:编写工业相机代码发布话题同步采集激光雷达和图像数据pcd文件转bin文件一、编写代码发布图像话题因为要同时采集激光雷达数据和图像数据,本文利用ROS的同步机制而没有采用相机的触发机制。而KITTI上,有这么一句话说明图像采集方法:The camera

2022-01-11 21:53:28 997

原创 LidarCameraCalibration

激光雷达与相机的标定采用的是autoware标定包和autoware...ai。分为下列步骤:标定板选择安装autoware标定包标定得到标定结果安装autoware...ai一、标定板的选择本文选择的标定板大小 600x450 mm,方格边长45mm,图案阵列为12x9。二、安装autoware标定包安装autoware标定包是来自于XidianLemon。將其下载下来后,编译。编译后进入此工作空间,运行:rosrun calibration_camera_lidar calib

2022-01-11 21:53:21 1355

原创 HKCamera

工业相机的选型以及安装选择一个工业相机和镜头,并需要和激光雷达进行联合标定。本文采用的是海康的工业相机和镜头,velodyne16线的激光雷达。一、工业相机型号和镜头型号工业相机: MV-CA013-21UM/UC镜头: MVL-HF0828M-6MP二、安装相机驱动并读取图像数据通过这个链接,下载客户端MVS。本文所使用的是ubuntu16.04,因此下载的是linx X86 平台。下载解压后有四个文件压缩包MVS-2.0.0_i386_20191126.debMVS-2.0.0_i38

2022-01-11 21:53:14 478

原创 3D 目标(pointpillars)识别方案

3D 目标(pointpillars)识别方案对车辆进行3D的目标识别,经过调研之后,发现autoware 和 apollo等平台均采用pointpillars算法。因此便尝试单纯使用激光雷达数据进行识别。方案实施步骤:理解pointpillars算法模型,并复现。了解自动驾驶数据集KITTI的格式。采集数据并标注。训练与部署。一、理解pointpillars算法模型pointpillars的论文解读可以看这篇论文解析。二、了解KITTI数据的格式因为pointpillars输入的数

2022-01-11 21:51:10 4644 25

原创 VideoMix 论文笔记

VideoMix: Rethinking Data Augmentation for Video Classification VideoMix 论文链接: https://arxiv.org/abs/2012.03457代码地址:https://github.com/jayChung0302/videomix一、 Problem Statement对于视频识别任务中的数据增强策略缺乏广泛的研究。 作者试验图像域(static image-domain)数据增强策略对视频数据的有效性,特别是基于特

2021-11-23 16:02:21 2563

原创 Data Augmentation for Video Recognition 论文笔记

Learning Temporally Invariant and Localizable Features via Data Augmentation for Video Recognition ECCV 2020 论文链接: https://arxiv.org/abs/2008.05721一、 Problem Statement图像识别中数据增强的目的是通过学习空间不变特征来增强泛化能力。比如,geometric (cropping,flipping,rotating等),photometric

2021-11-20 14:34:17 2706

原创 A Comprehensive Study of Deep Video Action Recognition 论文笔记

A Comprehensive Study of Deep Video Action Recognition 论文链接: https://arxiv.org/abs/2012.06567一、 Problem Statement来自于李沐团队关于Action Recognition的综述。二、 Direction介绍了video action recognition的挑战:modeling long range temporal information in videoshigh comp

2021-11-18 13:36:49 1246

原创 K-Net 论文笔记

K-Net: Towards Unified Image Segmentation K-Net NeurIPS2021论文链接: https://arxiv.org/abs/2106.14855一、 Problem Statement目前的语义分割方法直接学习一系列的预定好类别的卷积核(semantic kernels),然后使用这些卷积核进行像素分类。然而,鉴于图像中实例数量的变化,将这一概念扩展到实例分割并非易事。在语义分割中,每个卷积核负责查找图像中相似类别的所有像素。而在实例分割中,每个像

2021-11-16 16:01:06 5443

原创 UPSNet 论文笔记

UPSNet: A Unified Panoptic Segmentation Network UPSNet CVPR2019 论文链接: https://arxiv.org/abs/1901.03784一、 Problem Statement目前很多网络都是利用实例分割和语义分割,进行后处理后得到全景分割的效果,因此作者提出一个统一的网络解决全景分割问题。Motivation: Since both tasks aim at understanding the visual scene at t

2021-11-12 09:37:22 655

原创 Cascade R-CNN: Delving into High Quality Object Detection 论文笔记

Cascade R-CNN: Delving into High Quality Object DetectionCascade R-CNN CVPR2018论文链接: https://arxiv.org/abs/1712.00726一、 Problem Statement在目标检测中,通常使用IoU的值来确定正负样本,如果使用低的IoU值,会产生noisy detection,如果使用高的IoU值,会有两个问题:在训练的时候会过拟合,因为正样本的数量指数级减少。推理的时候与训练的时候不匹配。

2021-11-08 15:23:03 200

原创 Benchmarking Robustness in Object Detection: Autonomous Driving when Winter is Coming 论文笔记

Benchmarking Robustness in Object Detection: Autonomous Driving when Winter is Coming 论文链接: https://arxiv.org/abs/1907.07484一、 Problem Statement几种类型的失真来增强训练数据,并不是实现对以前未知的失真的鲁棒性的解决方案。最近的研究表明,CNN对新的失真类型的泛化能力较差,尽管CNN接受了各种其他失真的训练。本文 关注不太极端但更常见的可感知图像失真问题,如

2021-11-03 09:41:09 267

原创 ThunderNet 论文笔记

ThunderNet: Towards Real-time Generic Object Detection ThunderNet 论文链接: https://arxiv.org/abs/1903.11752一、 Problem Statement作者设计一个在计算资源有限的情况下,能达到实时的检测器。目前的detectors分为两类:two-stage detectorsone-stage detectorstwo-stage检测器如Light-Head R-CNN,有一个缺点就是w

2021-11-02 14:06:21 239

原创 Panoptic Feature Pyramid Networks 论文笔记

Panoptic Feature Pyramid Networks CVPR 2019 论文链接: https://arxiv.org/abs/1901.02446一、 Problem Statement提出一个Panoptic Segmentation的baseline。目前的全景分割都是使用不同的网络进行实例分割和语义分割,并不够高效。二、 Direction使用一个统一的网络结构去实现两个任务,实例分割和语义分割,进一步实现全景分割。因此作者在基于FPN和Mask R-CNN,添加了一

2021-11-02 09:29:48 226

原创 Apollo 星火计划课程笔记 ---- Perception

Apollo Perception感知系统:传感器: Lidar, Camera, Radar, Ultrasonic, Phone地图: 高精地图机器输出:道路信息:不强求在线识别,可以来自高精地图;场景理解,分割;障碍物信息:障碍物检测(位置,类别,形状大小),障碍物跟踪(轨迹,速度),传感器融合(更安全)信号灯信息: camera识别颜色,其他信息来自地图;v2x是终极途径。Part-1 多个维度看问题感知技术模块:大感知: 标定,定位,障碍物行为预测小感知: 检测,

2021-10-28 20:34:31 589

原创 Dynamic Head 论文笔记

Dynamic Head: Unifying Object Detection Heads with Attentions Dynamic Head CVPR 2021论文链接: https://arxiv.org/abs/2106.08322一、 Problem Statement设计一个好的目标检测头应该有三个准则:scale-awarespatial-awaretask-aware目前的检测头都只关注其中一个,因此需要解决把三个统一结合起来。二、 Direction设计一个

2021-10-28 11:59:42 2192 4

原创 PVTv2 论文笔记

PVTv2: Improved Baselines with Pyramid Vision Transformer PVTv2 论文链接: https://arxiv.org/abs/2106.13797一、 Problem StatementPVTv1 有三个缺点:把图片当成是non-overlapping patches的序列,一定程度上丢失了图像的局部联系。PVTv1的position encoding是固定大小的,对处理任意图片大小不灵活。当处理大分辨率的输入图像时候,计算发杂度相对

2021-10-27 10:24:48 2143

原创 RepVGG 论文笔记

RepVGG: Making VGG-style ConvNets Great Again RepVGG CVPR 2021论文链接: https://arxiv.org/abs/2101.03697一、 Problem Statement目前的网络结构普遍有以下缺点:复杂的分支结构: residual addtion, branch-concatenation等等,使得模型推理速度降低和减少内存的利用。增加了MAC: depthwise convolution, channel shuff

2021-10-26 15:06:24 228

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除