现实生活中,除了人本身有两只眼睛可以通过双目视觉信息获取深度信息,我们很难方便的有如此稳定和精确的双目系统来测深度。最近接触到了AR.Drone的无人机,开放接口这种事情最喜欢了,似乎可以用深度信息来控制无人机的运动,不过介于无人机只有单目摄像头的限制,不得不转换思维,开始搜集论文研究如何用单目视觉信息来获取深度。
提取单目视觉信息的方式可以包括两种,基于静止的单张图像和基于运动的多张图像。
这篇是之前看了Andrew N.g.的05年ICML论文(High Speed Obstacle Avoidance using Monocular Vision and
Reinforcement Learning (ICML,2005)),做了一次组会分享的内容,希望基于此启发感兴趣的童鞋,之后会做更多方法和实验的跟进。
论文里解决的是玩具车的无人导航系统问题,实验提出的假设如上图所示:
1、玩具车行驶速度一般在5m/s,所以1s内发给玩具车的命令必须保证选择5m内没有障碍的方向行驶,当然可能1s内已经有多次计算,很多指令发出,这基于算法和图像传输效率。
2、外界环境是不规则的,论文在训练参数的时候所在的环境是一个灌木丛生,叶子随处可见,偶尔还有石凳的小花园,视觉系统的参数被训练好(论文里还使用了合