- 博客(9)
- 收藏
- 关注
原创 (BEV论文精读) ICRA‘23:BEVFusion
由于相机具有不同的视角,因此相同的特征张量可能会代表不同的空间位置,因此需要找到一个共同的表达方式,它满足所有的张量可以轻松到这一特征空间中,并且使用于不同的任务中。我们将多个特定于任务的头部应用于融合的BEV特征图。(3)这将生成大小为NHWD的摄像机特征点云,其中N是摄像机的数量,(H,W)是摄像机特征地图大小。(2)相机内外参是是固定的,因此相机特征点云的坐标是固定的,所以将3D坐标和BEV中的点联系起来。(3)将BEV中的点排序并进行记录,在推理时,只需要在预先计算的排列中去记录所有特征点。
2024-07-29 15:16:32 575
原创 模型部署03 CMake
在实际工作中推荐使用CMake构建C++项目,CMake是用于和软件的开源工具;build静态链接库和动态链接库所谓静态和动态,其区别是链接的阶段不一样。静态链接库链接发生在编译环节,库名称为.a(archicve library),最终输出的库或可执行文件会将静态连接库打包到工程的输出文件中(可执行文件或库),因此文件较大。动态链接库链接发生在程序执行过程中,库名称为.so(shared object) , 动态库加载后,在内存中仅仅保存一份拷贝,多个程序依赖它,不会重复加载。
2024-04-24 16:08:05 362
原创 模型部署02 C++容器
map是一种关联式容器,它的元素是key-value对(std::pair),key是唯一的,value可以重复。* 与vector不同,deque在内存中是分段连续的,每段内存都是连续的,所以在头部和尾部插入和删除元素都很快。* 与array一样,vector在内存中是连续的,对应的内存空间会随着元素的增加而增加。* 在vector中间增加、删除元素的复杂度是线性的,与vector的大小有关。* 在vector末尾增加、删除元素的复杂度是常数,与vector的大小无关。
2024-04-23 14:33:57 362
原创 (BEV论文精读)ECCV 2022|BEV经典之作:BEVFormer
BEVFormer 利用空间和时间信息,通过预定的网格状 BEV 查询向量与空间和时间域交互。为了聚合空间信息,我们设计了一个空间交叉注意力,每个BEV查询向量从跨相机视图的感兴趣区域提取空间特征。对于时间信息,我们提出了一种时间自注意力来递归融合历史 BEV 信息。我们的方法在nuScenes测试集上的 NDS 指标达到了最新的 56.9%,比之前的最佳技术高出 9.0 分,与基于 lidar 的基线性能相当。
2024-02-02 17:00:18 936
原创 (Re-ID论文精读3)WACV2023 | Body Part-Based Representation Learning for Occluded PersonRe-Identificatio
提出问题:对于遮挡场景下的REID任务,part-based 的方法使很适合且较为有效的,但是对于part-based的模型目前有两个问题:(1)提取局部特征不如全局特征更有效,两个ID可能有着极为相似的局部特征,因此常规的标签并不能满足遮挡场景下的REID任务(2)REID 数据集缺少遮挡场景的人员annotations解决问题:(1)提出BPBreID,一个body part-based ReID模型,其中设计了一个body part attention 模块来提取part-based 特征。
2024-02-01 15:40:45 1506
原创 (Re-ID论文精读2)CVPR2023: Patch-wise High-frequency Augmentation for Transformer-basedPerson Re-id
挖坑(提出问题):自从这个VIT应用在reid领域,效果显著,比CNN要好,但是呢在High-frequency信息呢CNN的效果是优与VIT的,比如这个衣服的纹理细节,因为这个VIT 的Self-Attention机制会利用low-frequency信息把High-frequency信息“稀释”掉。
2024-01-31 17:08:29 1307
原创 (Re-ID论文精读)PASS: Part-Aware Self-Supervised Pre-Training for Person Re-Identification
提出问题(挖坑):文章一开始直接表明,现有的reid的backone都是直接在imageNet的数据集进行SSL(此处挖个坑,后面讲什么是ssl)的预训练,而ImageNet,是一个主要是以分类任务的数据集不适合Person reid 领域,因此设计了一个PASS这个网络填坑:这个PASS就是为了解决这个问题的,但是有人问了,那我构造一个关于RE-id的大规模数据集在这个上面预训练就行了呗,还需要其他东西吗。
2024-01-31 00:00:38 1388 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人