自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(18)
  • 收藏
  • 关注

原创 Linux下Vision Mamba环境配置+多CUDA版本切换

Linux 下 Vision Mamba的环境配置。笔者在linux下选用CUDA11.8版本,也比较推荐读者使用此版本,方便后续环境配置。

2024-05-19 22:00:00 1844 2

原创 Vision Mamba论文阅读(主干网络)

简单看看,文章介绍了Vim模型,这是一种新的通用视觉基础模型,它利用双向Mamba块(bidirectional Mamba blocks (Vim))和位置嵌入 (position embeddings)来处理图像序列,并在ImageNet分类、COCO对象检测和ADE20K语义分割任务上取得了比现有的视觉Transformer模型(如DeiT)更好的性能。指出了Mamba时间复杂度与序列长度是线性的。而Transformer的时间复杂度是与序列长度乘二次方关系。

2024-05-18 22:00:00 1798

原创 单目深度估计---Depth Anything论文详解

论文题目:Depth Anything: Unleashing the Power of Large-Scale—— 任何深度:释放大规模无标记数据的力量(注意论文名字,因为后续的很多工作都是在未标注数据上做的。作者认为Depth Anything是一种用于稳健单目深度估计的非常实用的解决方案。在不追求新颖的技术模块的情况下,作者目标建立一个简单而强大的基础模型(而且是Zero-shot)。为此,作者通过设计一个数据引擎来收集并自动标注大规模未标记数据(∼62M),从而扩大数据覆盖范围,来能够减少泛化误差。

2024-03-30 16:10:17 4946 13

原创 BEV感知---BevFormer详解

论文名字其中关键词是Spatiotemporal 时空的 , 分开即 spatia 空间的l ,temporal 时间的。可见本论文在BEV感知上引入了时间和空间的因素。相比之前的BEV算法来说,这是比较有创新的一点。具体的,下图所示,上面的分支进行空间特征(多视角图像特征)注意力(spatial cross-attention)。下面的分支进行时间特征注意力(temporal self-attention),可以看到作者这里把前一时刻(t-1时刻)的BEV特征当作是时间特征。

2024-03-25 15:50:23 2444

原创 BEV感知---BevFusion详解

一种非常经典的多模态融合感知方案叫 BEVFusion。这是一种用于多任务多传感器 3D 感知的高效通用框架。BEVFusion 将相机和 LiDAR 功能统一在共享 BEV 空间中,完全保留几何和语义信息。相机和点云分支没有明显的主次关系,相互独立,结果上又相辅相成。高效、准确的多传感器感知对于自动驾驶汽车的安全至关重要。BEVFusion 将最先进的多传感器融合模型的计算成本降低了一半,并在小而远的物体以及雨天和夜间条件下实现了大幅精度提高。它为安全、稳健的自动驾驶铺平了道路。

2024-03-21 15:08:26 3740 4

原创 BEV感知---LSS详解(Lift模块)

Lift splat shoot论文讲解,主要针对于Lift模块

2024-03-18 14:53:11 1605

原创 ARTrack论文阅读分享(单目标跟踪)

ARTrack论文阅读及个人分析。本读者对于Decoder(解码器)中的优化点-----解耦的地方还是有点疑惑(作者对此也暂时还没开源)。

2024-02-14 16:19:18 1721 1

原创 BackTrack论文阅读分享(单目标跟踪)

本论文(BackTrack)重新思考了当下更新在线模板的局限性。然后就提出了前/后向轨迹思想,配合两个约束条件,新增更新在线模板的约束条件。并提出了早期拒绝和早期终止来弥补降低的FPS,进一步探讨了不同设置对模型的影响。

2023-12-19 21:48:14 252

原创 3D目标检测(点云+体素)——PV-RCNN

PV-RCNN论文阅读及个人分析。

2023-10-31 21:29:25 1491

原创 3D目标检测(基于点云)——3DSSD

3DSSD论文阅读及个人分析。

2023-10-17 20:54:24 315

原创 FLatten Transformer 线性注意力的改进

论文作者指出当下Linear Attention的2个不足,并提出对应的改进点。使得Linear Attention和Softmax Attention的效果一致,甚至超越。

2023-10-16 21:34:55 1266 2

原创 OSTrack论文阅读分享(单目标跟踪)

OSTrack论文(尤其是其中的候选消除模块)讲解

2023-06-06 21:14:45 8202 21

原创 简述YOLOv8与YOLOv5的区别

yolov7,yoloX相关论文还没细看,yolov8就出来了。太卷了!YOLOv5和YOLOv8的区别。

2023-03-01 11:12:04 22386 2

原创 SiamRPN代码讲解,训练过程讲解

以代码+注释的形式,详解siamrpm的训练过程。

2022-10-08 21:20:42 2208 7

原创 SiamRPN代码讲解,推理测试讲解

以代码+注释的形式,详解siamrpm的推理过程。后续会详解siamrpn的训练过程。

2022-10-07 14:17:25 4277 4

原创 SiamFC代码讲解,训练过程讲解

以代码+注释的形式,详解siamfc的训练过程。

2022-10-02 13:34:31 2034

原创 SiamFC代码讲解,推理测试讲解

以代码+注释的形式,详解siamfc的推理过程。后续会详解siamfc的训练过程。

2022-10-01 16:03:34 2095 2

原创 ViTAE论文阅读与官方代码讲解

论文部分片段阅读与官方代码讲解

2022-09-26 15:28:04 1909 3

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除