自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 SFD: Sparse Fuse Dense安装记录

因为运行demo出现的keyerror问题,暂时不是很重要,于是就通过运行test.py来验证模型能否跑通。test的结果,AP相当可观。

2023-12-11 17:13:40 1085 2

原创 论文记录MSMDFusion 2023CVPR

作者认为在2D空间里的nearest不代表在3D空间是nearest的,所以MDU为了提高容错率,每个seed选择多个depth(毕竟参考点多了,总能命中),对每个seed选取了K个depth,这样也就增加了virtual points的数量,变相丰富了3D的points。于是作者使用Liner和sigmod将不同的射线赋予不同的权值,这样K个来自同一个seed的virtual points所带的语义信息也不只是depth的不同了,而是根据depth的不同带有不同的feature。

2023-10-21 18:55:15 303 2

原创 论文记录MVP:Multimodal Virtual Point 3D Detection

t时刻下,real point的特征是(x,y,z,t,r),而virtual point的特征是(x,y,z,t,e),对于real和virtual point的融合简单办法是直接堆叠成(x,y,z,t,r,e),缺少的那一维直接补0。有了2D detection的结果,我们的目标是从这些2D detection得到一些3D虚拟点virtual points vi,其中e是2D detector得到的semantic information,为了简单理解,使用类别分数做e。为什么是frustum呢?

2023-10-21 18:47:33 360 1

原创 论文记录VoxelNet: End-to-End Learning for Point Cloud Based 3D Object Detection

2.point-wise input:把Vin中的每个点pi^送至fully connected network(FCN)中提取特征,实际上做了个升维操作,原本pi^长度为7,升维后变成了长度为C1,自此点也就变成了特征fi,tensor也从(N,35,7)变成了(N,35,C1);1.预处理:找出V里面的质心点(vx,vy,vz),计算其他点对质心的偏移offset,将V更新为Vin ,tensor从(N,35,4)变成了(N,35,7);tensor为(N,35,4),N为非空体素个数。

2023-10-21 18:44:06 95 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除