论文阅读
文章平均质量分 95
啊 昃
本人英语水平、阅读论文能力、读写代码能力较为有限。有错误,恳请大佬指正,感谢。
欢迎交流
邮箱:refreshmentccoffee@gmail.com
(2024年4四月份后因撰写论文,暂时停更,敬请期待。)
展开
-
Vision Mamba论文阅读(主干网络)
简单看看,文章介绍了Vim模型,这是一种新的通用视觉基础模型,它利用双向Mamba块(bidirectional Mamba blocks (Vim))和位置嵌入 (position embeddings)来处理图像序列,并在ImageNet分类、COCO对象检测和ADE20K语义分割任务上取得了比现有的视觉Transformer模型(如DeiT)更好的性能。指出了Mamba时间复杂度与序列长度是线性的。而Transformer的时间复杂度是与序列长度乘二次方关系。原创 2024-05-18 22:00:00 · 2383 阅读 · 0 评论 -
单目深度估计---Depth Anything论文详解
论文题目:Depth Anything: Unleashing the Power of Large-Scale—— 任何深度:释放大规模无标记数据的力量(注意论文名字,因为后续的很多工作都是在未标注数据上做的。作者认为Depth Anything是一种用于稳健单目深度估计的非常实用的解决方案。在不追求新颖的技术模块的情况下,作者目标建立一个简单而强大的基础模型(而且是Zero-shot)。为此,作者通过设计一个数据引擎来收集并自动标注大规模未标记数据(∼62M),从而扩大数据覆盖范围,来能够减少泛化误差。原创 2024-03-30 16:10:17 · 6679 阅读 · 14 评论 -
BEV感知---BevFormer详解
论文名字其中关键词是Spatiotemporal 时空的 , 分开即 spatia 空间的l ,temporal 时间的。可见本论文在BEV感知上引入了时间和空间的因素。相比之前的BEV算法来说,这是比较有创新的一点。具体的,下图所示,上面的分支进行空间特征(多视角图像特征)注意力(spatial cross-attention)。下面的分支进行时间特征注意力(temporal self-attention),可以看到作者这里把前一时刻(t-1时刻)的BEV特征当作是时间特征。原创 2024-03-25 15:50:23 · 3360 阅读 · 0 评论 -
BEV感知---BevFusion详解
一种非常经典的多模态融合感知方案叫 BEVFusion。这是一种用于多任务多传感器 3D 感知的高效通用框架。BEVFusion 将相机和 LiDAR 功能统一在共享 BEV 空间中,完全保留几何和语义信息。相机和点云分支没有明显的主次关系,相互独立,结果上又相辅相成。高效、准确的多传感器感知对于自动驾驶汽车的安全至关重要。BEVFusion 将最先进的多传感器融合模型的计算成本降低了一半,并在小而远的物体以及雨天和夜间条件下实现了大幅精度提高。它为安全、稳健的自动驾驶铺平了道路。原创 2024-03-21 15:08:26 · 5379 阅读 · 4 评论 -
BEV感知---LSS详解(Lift模块)
Lift splat shoot论文讲解,主要针对于Lift模块原创 2024-03-18 14:53:11 · 1846 阅读 · 0 评论 -
ARTrack论文阅读分享(单目标跟踪)
ARTrack论文阅读及个人分析。本读者对于Decoder(解码器)中的优化点-----解耦的地方还是有点疑惑(作者对此也暂时还没开源)。原创 2024-02-14 16:19:18 · 1952 阅读 · 1 评论 -
BackTrack论文阅读分享(单目标跟踪)
本论文(BackTrack)重新思考了当下更新在线模板的局限性。然后就提出了前/后向轨迹思想,配合两个约束条件,新增更新在线模板的约束条件。并提出了早期拒绝和早期终止来弥补降低的FPS,进一步探讨了不同设置对模型的影响。原创 2023-12-19 21:48:14 · 290 阅读 · 0 评论 -
3D目标检测(点云+体素)——PV-RCNN
PV-RCNN论文阅读及个人分析。原创 2023-10-31 21:29:25 · 1757 阅读 · 0 评论 -
3D目标检测(基于点云)——3DSSD
3DSSD论文阅读及个人分析。原创 2023-10-17 20:54:24 · 365 阅读 · 0 评论 -
FLatten Transformer 线性注意力的改进
论文作者指出当下Linear Attention的2个不足,并提出对应的改进点。使得Linear Attention和Softmax Attention的效果一致,甚至超越。原创 2023-10-16 21:34:55 · 1435 阅读 · 2 评论 -
OSTrack论文阅读分享(单目标跟踪)
OSTrack论文(尤其是其中的候选消除模块)讲解原创 2023-06-06 21:14:45 · 9117 阅读 · 22 评论 -
SiamRPN代码讲解,训练过程讲解
以代码+注释的形式,详解siamrpm的训练过程。原创 2022-10-08 21:20:42 · 2400 阅读 · 7 评论 -
SiamRPN代码讲解,推理测试讲解
以代码+注释的形式,详解siamrpm的推理过程。后续会详解siamrpn的训练过程。原创 2022-10-07 14:17:25 · 4646 阅读 · 4 评论 -
SiamFC代码讲解,训练过程讲解
以代码+注释的形式,详解siamfc的训练过程。原创 2022-10-02 13:34:31 · 2236 阅读 · 0 评论 -
SiamFC代码讲解,推理测试讲解
以代码+注释的形式,详解siamfc的推理过程。后续会详解siamfc的训练过程。原创 2022-10-01 16:03:34 · 2369 阅读 · 2 评论 -
ViTAE论文阅读与官方代码讲解
论文部分片段阅读与官方代码讲解原创 2022-09-26 15:28:04 · 2411 阅读 · 3 评论