目标检测YOLO系列从入门到精通技术详解100篇-【目标检测】单目视觉估计

本文详细探讨了单目视觉在3D目标检测和深度估计中的应用,包括算法原理、数据集介绍、数据处理、相关工作和最新网络结构。介绍了单目3D目标检测的挑战,如误差放大问题,以及解决方案GUP模块和HTL(分层任务学习)。文章还对比分析了基于双目视觉、视频和图像风格迁移的单目深度估计方法,展示了各种方法的优缺点和应用场景。
摘要由CSDN通过智能技术生成

目录

前言

算法原理

单目3D目标检测新网络

GUP module以及HTL

单目深度估计

数据集介绍

2.1 KITTI

2.2 vKITTI

2.3 Cityscapes

2.4 NYU Depth V2

2.5 ScanNet

2.6 Make3D

数据处理

3.1 数据组成

3.2 数据处理

3.3 评价指标

相关工作

4.1 基于单目视觉的深度估计

4.2 结合双目视觉的单目深度估计

4.3 基于视频的相机位姿估计和视觉测距

4.4 基于图像风格迁移的单目深度估计

4.5 多任务深度估计


 

前言

深度学习直接通过大数据的训练得到/调整一个深度NN模型的参数,在当今计算能力日新月异的平台(GPU/FPGA/ASIC/Muli-core)上实现了计算机视觉/语音识别/自然语言处理(NLP)等领域一些应用的突破。但是专家们还是对今后深度学习的发展有些期待和展望,比如

  • 非监督学习方法的引入减轻大数据标注的负担,比如GAN;

  • NN模型的压缩和精简以普及深度学习在移动终端甚至物联网终端的广泛应用;

  • 还有深度学习能够更多的引入人类知识和简单可靠的推理,以减少“暴力“学习的误差和错误,比如贝叶斯理论,知识图谱,逻辑推理,符号学习,多任务联合训练和迁移学习等等。

算法原理

深度估计问题在计算机视觉领域属于3-D重建的一部分,即Shape from X。这个X包括stereo, multiple view stereo, silho

  • 19
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

格图素书

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值