双目测距系列(六)monodepth2的三种训练方式

前言

monodepth2有三种训练方式,其对应的命令如下:

下面分别对这三种训练模式进行较详细解释 :

1)单目训练

monocular是单目的意思,而双目的英文则是binocular。现在基于深度学习方法对单目图像重构出三维世界非常流行。我个人觉得这里面的基础理论是SFM(structure From Motion)。直白讲,它是依靠运动视频的图像帧序列来进行三维重建。其优势很明显,只需要一个摄像头即可,当然前提条件则是,需要摄像头本身动起来,拍一段视频流。

在monodepth2的单目模型训练中,它缺省需要一个参数--frames_ids 0 -1 1。0代表当前输入的样本图片,-1则代表当前帧在这个视频系列中的上一帧,1则代表下一帧。

2)立体训练

stereo字面意思为立体,这里更准确的含意则为双目。有两个重要参数:--frame_ids 0和--use_stereo。前者意味着不需要对当前输入帧来找上下帧了;后者意味要对当前帧来找它的另外一帧,比如当前帧为左摄像头拍摄得到的帧,那么其对应的另外一帧则为右摄像头的。

这种模型比较适合带双目摄像头,且设备固定在某一个位置上。

3)单目+立体训练

这种方法是前面两种的组合,适用于有双目摄像头,且是运动的场景。 由于它是前两种的综合体,所以训练速度会比较慢。

结论

刚接触这个模型的同学可能会好奇到底哪种训练方式得到的模型更准确。其实从paper看,作者并没有做出优劣的比较(他觉得都挺好),反过来着重提供了针对不同场景的三种训练方式,合适的就是最好的。 

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

ltshan139

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值