所谓强AI是指和人一样能够用一种通用算法实现不同功能的AI。
现在任何有点常识的人一听到强AI,就会皱起眉头:那还是现在技术瓶颈以外的能力。但我一直在思考这个通向强AI的那把金钥匙究竟在哪里?最近突然觉得也许强AI需要的技术已经成熟,只是我们不知道怎么把现有的技术结合在一起。
计算机视觉是指通过处理视频信息,提取出摄像头周围的各种场景信息,比如什么位置有一个什么物体,有多大,我们把这些场景信息叫做地图,这个过程叫建图。因为利用这些场景信息,可以反过来计算出摄像头在场景中的位置,这个过程叫做定位。并且对于场景中的物体,还会识别他们大概是什么东西。其实这正是是人的视觉系统负责的任务:当我来到一个新的环境中时,我们环顾四周,然后来回走动一下,大概能知道周围有些什么物体,有多大,有多远,有些什么属性。然后我们就可以自如的在新环境中穿梭而不会到处碰撞。
目前计算机视觉的水平大概是:对于地图和定位的精度可以达到人的水平,并且可以分割出不同的物体。然后再结合现有识别算法,可以知道每个物体的名字。如果我们还有一套名字和属性的数据库,我们就能知道每个物体大概有些什么特点和功能。但这里的瓶颈是如果想要万能的识别任何物体,需要极其大量的人工物体标注和训练,且不说现在的算法能否支持如此大量的数据。计算机视觉方面的强AI瓶颈正式在这里。
那么这里出现了两个问题:
1,强AI是否真的需要万能的识别世界上所有的物体。
我们认为即使是才出生的婴儿的智力也是能够达到强AI的要求。但是婴儿能够识别的物体非常有限,基本就是屋里那几样东西。所以当我们把使用机器人的场景限定一下,比如只在室内,只是可移动的物体。这样需要标注和训练的量就打打减少了。其实一个成年人能够识别出无以计