计算机视觉+自然语言处理=强AI?

所谓强AI是指和人一样能够用一种通用算法实现不同功能的AI。

现在任何有点常识的人一听到强AI,就会皱起眉头:那还是现在技术瓶颈以外的能力。但我一直在思考这个通向强AI的那把金钥匙究竟在哪里?最近突然觉得也许强AI需要的技术已经成熟,只是我们不知道怎么把现有的技术结合在一起。

 

计算机视觉是指通过处理视频信息,提取出摄像头周围的各种场景信息,比如什么位置有一个什么物体,有多大,我们把这些场景信息叫做地图,这个过程叫建图。因为利用这些场景信息,可以反过来计算出摄像头在场景中的位置,这个过程叫做定位。并且对于场景中的物体,还会识别他们大概是什么东西。其实这正是是人的视觉系统负责的任务:当我来到一个新的环境中时,我们环顾四周,然后来回走动一下,大概能知道周围有些什么物体,有多大,有多远,有些什么属性。然后我们就可以自如的在新环境中穿梭而不会到处碰撞。

目前计算机视觉的水平大概是:对于地图和定位的精度可以达到人的水平,并且可以分割出不同的物体。然后再结合现有识别算法,可以知道每个物体的名字。如果我们还有一套名字和属性的数据库,我们就能知道每个物体大概有些什么特点和功能。但这里的瓶颈是如果想要万能的识别任何物体,需要极其大量的人工物体标注和训练,且不说现在的算法能否支持如此大量的数据。计算机视觉方面的强AI瓶颈正式在这里。

那么这里出现了两个问题:

1,强AI是否真的需要万能的识别世界上所有的物体。

我们认为即使是才出生的婴儿的智力也是能够达到强AI的要求。但是婴儿能够识别的物体非常有限,基本就是屋里那几样东西。所以当我们把使用机器人的场景限定一下,比如只在室内,只是可移动的物体。这样需要标注和训练的量就打打减少了。其实一个成年人能够识别出无以计

  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值