美国斯坦福大学开发出新的机器视觉算法

转载 2007年09月20日 08:58:00
 美国斯坦福大学开发出新的机器视觉算法     CSDN Blog推出文章指数概念,文章指数是对Blog文章综合评分后推算出的,综合评分项分别是该文章的点击量,回复次数,被网摘收录数量,文章长度和文章类型;满分100,每月更新一次。
     美国Stanford大学计算机系的副教授 Andrew Ng开发出新的机器视觉算法,仅使用一个摄像头就获得物体的距离信息,不同于以往的视觉算法需要立体视觉来获得距离信息。这将大大简化机器人的传感器系统。
  除了像在2003年的《矩阵革命》这种科幻电影中的,可怕的乌贼状机器人以令人难以置信的灵活运动外,大多数的机器人都非常笨拙无法越过障碍物快速行动。事实差不多如此因为他们很难用图像判断他们所“看见”的障碍物在前方多远处。这周,斯坦福的计算机科学家将演示一套机器视觉算法,这套算法能让机器人从一幅静止的图像中判断障碍物的大概距离。
   美丽的斯坦福大学远景
  “许多人都说从一幅单目图像来进行深度估计是不可能的,”计算机科学副教授Andrew Ng说,“我认为这项研究表明在实际问题中,单目深度估计不仅能够正常工作而且还非常有用。”Andrew Ng将在Vancouver 12月5-8日的Neural Information Processing Systems会议上演讲他的研究论文。
   随着内部传感器阵列大量的投入,机器人具有了足够的导航能力。去年十月在DARPA超级挑战中斯坦福的机器人小汽车斯坦利(Stanley)能够在沙漠上行驶,使用激光雷达和摄相头扫描前方道路。利用Ng和他的学生们的研究制造的机器人要不太小了不能带太多传感器要不因为只用一个摄像头进行导航必须造价便宜。实际上,使用简化版的算法,Ng已经能使无线电控制的小车在穿过混乱的丛林地带被撞翻前自动行驶几分钟。
  为了使机器人有深度感知的能力,Ng和他的研究生Ashutosh Saxena及Sung H.
Chung设计了软件使之能够学习发现静态图像中特定深度的信号。这种信号包括纹理的变化(接近的清晰显示的表面),边缘(收缩的线条,就像路的两边,指示增加的距离)和朦胧感(朦胧感的物体好像更远了)。为了尽可能彻底地分析这些信号,软件将图像分成几个部分对他们同时进行各别分析和涉及邻近部分的分析。这使得软件能够推测出图像中各个物体之间的关系。软件同样要在不同放大水平下寻找信号来确保其没有丢失详细资料或偏离主流趋势-那真是为了一棵树丢掉森林。
  使用斯坦福算法,在室内和室外机器人能以平均35的错误率判断距离-也就是说,实际在30英尺远的树被感知为20到40英尺之间。每小时走20英里通过视频帧每秒进行10次距离判断的机器人即使在这些都不确定时也有充分的时间来调整它的路线。Ng指出相比传统的立体视觉算法——使用两个摄像头和三角测量来推断深度,新的软件能够可靠的探测5到10倍距离远
  “使视觉深度感知适用于长距离这个难点已成为实现机器人快速移动和导航的主要障碍,”
  Ng说到。“我想造一架能穿越森林飞行的飞机,绕过周围的树在树荫底下飞行。”当然,这又令人想起了另一个电影画面:在Return of the Jedi中Ewok星球上飞机穿越森林追赶的场景。Ng想让这个主意超越幻想领域使之成为现实。  

 

相关文章推荐

【学习笔记】斯坦福大学公开课(机器学习) 之生成学习算法:朴素贝叶斯

朴素贝叶斯(Naive Bayes)在上一篇介绍的高斯判别分析模型,特征向量XX是连续的实向量。对于离散的特征值来说xx,我们就需要用到另一种模型。 现在我们需要建立一个模型,来识别一封邮件是否是垃...

斯坦福大学机器学习——EM算法求解高斯混合模型

EM算法(Expection-Maximizationalgorithm,EM)是一种迭代算法,通过E步和M步两大迭代步骤,每次迭代都使极大似然函数增加。但是,由于初始值的不同,可能会使似然函数陷入局...

斯坦福大学机器学习——K-means算法

k-means通过设置重心和移动中心两个简答的步骤,就实现了数据的聚类。下面就来介绍下k-means算法。 一、   数值属性距离度量 度量数值属性相似度最简单的方法就是计算不同数值间的“距离”,如果...

斯坦福大学机器学习公开课, 梯度下降算法,随机梯度下降算法,最小二乘拟合法总结以及证明

部分语言参考了:http://blog.csdn.net/woxincd/article/details/7040944 回归与梯度下降: 回归在数学上来说是给定一个点集,能够用一条曲线去拟合之,如...

美国名校的与机器视觉相关的研发中心网址

美国名校的与机器视觉相关的研发中心网址 最近简单整理了一下美国在2010年进入英国泰晤士报全球排名前100的名校中的图像处理、机器视觉研究中心,其中可能包含人脸检测与识别、人体检测、...

2010年机器视觉试题及答案(山东大学控制科学与工程学院)

答案 1 在游程长度编码中经常运用两种方法,一种是使用1的起始位置和1的游程长度,另一种是仅仅使用游程长度,但须从1的游程长度开始描述,如图3.6所示.   0    ...

斯坦福大学机器学习公开课 ---Octave Tutorial Transcript

斯坦福大学机器学习公开课 ---Octave Tutorial Transcript Prompt can be changed with the command PS1('>> '). Tran...
  • E_pen
  • E_pen
  • 2015-01-30 21:11
  • 1449
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:深度学习:神经网络中的前向传播和反向传播算法推导
举报原因:
原因补充:

(最多只允许输入30个字)