自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

Hali_Botebie的博客

一步一步来，闻道有先后，术业有专攻，Github主页：https://hiyx.github.io，Gitee：https://gitee.com/hiyanyx

博客等级

码龄14年

485
原创

4466
点赞

1万+
收藏

3405
粉丝

关注

私信

热门文章

分类专栏

最新评论

解决visio2021与本地家庭和学生版office21不兼容问题
H32_123456: 找到秘钥了吗
【鱼眼镜头11】Kannala-Brandt模型和Scaramuzza多项式模型区别，哪个更好？
weixin_43104176: 至少读一读原论文吧
[vip]【MLP-BEV(10)】BEVPooling V1和BEVPooling V2的view_transformer，进行鱼眼图片实践
weixin_48390730: 感谢回复！所以我可以理解为，均匀采样就是特征在每个深度区间都有投影，但最大深度采样就是特征只在最大概率的深度区间有投影，减少了很多计算量，除此以外就没其他的区别了吗
[vip]【MLP-BEV(10)】BEVPooling V1和BEVPooling V2的view_transformer，进行鱼眼图片实践
Hali_Botebie: 这是一个非常核心的工程实现问题。简单来说：最大深度采样只能得到“深度值”，而3D视锥体网格（Frustum）是生成“深度假设”的“脚手架”。为了让你直观理解，我们可以把整个过程拆解为三个步骤： 1. 3D视锥体网格（Frustum）：搭建“候选深度”的脚手架作用：在3D空间中，沿着相机光线的方向，预先划分出一个个“深度区间”或“深度层”。为什么需要它：计算机无法直接处理连续的深度空间（比如从0米到无穷远）。我们必须把空间离散化，变成一个个“格子”。这个网格就是用来定义这些格子的。类比：就像你要测量一个物体的长度，你需要先准备一把尺子（上面有刻度）。Frustum就是这把“3D尺子”。 2. 最大深度采样：在脚手架上“选点” 作用：当神经网络计算出每个“格子”里存在物体的概率后，最大深度采样会选择概率最高的那个格子。为什么需要它：它负责做决策，告诉你“物体到底在哪个格子里”。 3. 得到3D点：利用脚手架计算坐标过程：当你通过最大深度采样确定了物体在第N层格子时，你并不能直接得到3D点。你需要利用Frustum网格的几何关系，结合相机的内参（焦距、主点），才能将“第N层”这个索引值，换算成具体的3D坐标（X, Y, Z）。总结 Frustum是“尺子”，最大深度采样是“读数”，两者结合才能得到“长度”。没有Frustum这把尺子，最大深度采样就不知道“深度值”对应的是空间中的哪个具体位置。
[vip]【MLP-BEV(10)】BEVPooling V1和BEVPooling V2的view_transformer，进行鱼眼图片实践
weixin_48390730: 请教博主，你说的最大深度采样就是用argmax代替softmax的操作吗？create_frustum还是按照深度区间均匀生成吗，盼复感谢

DNN深度神经网络

关注

文章平均质量分 85

http://www.auto-mooc.com/mooc/detail?mooc_id=F51511B0209FB73D81EAC260B63B2A21的学习笔记

关注数：文章数：45 文章阅读量：97588 文章收藏量：503

作者: Hali_Botebie

这个作者很懒，什么都没留下…

展开

专栏收录文章