视觉3D感知(一):初步认识

一、3D视觉感知过程

1.输入:单摄像头或多摄像头生成的图像数据

  • 单张图像
  • 图像序列

2.输出

  • 稀疏:物体在3D坐标系中的位置、大小、朝向、速度等

请添加图片描述

  • 稠密:像素点的类别标签和深度信息

请添加图片描述

3.算法

  • 按输入来分:单目、双目、多目
  • 按输出来分:3D物体检测、场景深度估计

二.感知任务

1.难点

  • 图像是真实世界在透视视图下的投影

  • 透视投影导致距离/深度信息丢失

  • 图像上物体的大小随距离而变化

  • 很难估计物体的实际距离和大小

2.解决方案

  • 借助其他传感器,比如激光雷达
  • 借助几何假设和约束来辅助求解病态问题
  • 借助深度学习自动地从图像中提取3D信息
    何假设和约束来辅助求解病态问题
  • 借助深度学习自动地从图像中提取3D信息
  • 借助多个摄像头和立体视觉算法
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

anthony-36

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值