计算机视觉+自然语言处理=强AI？

最新推荐文章于 2024-07-17 10:18:40 发布

chamomoe

最新推荐文章于 2024-07-17 10:18:40 发布

阅读量3.4k

点赞数 1

分类专栏：科技评论文章标签：强AI 人工智能家庭机器人

本文链接：https://blog.csdn.net/ziliwangmoe/article/details/81433217

版权

文章探讨了将计算机视觉和自然语言处理技术结合，以实现强AI的可能性。通过限制场景和使用激励机制，可以降低物体识别和语言理解的难度。作者提出，通过类似教导婴儿的方式，让机器人学习环境、识别物体和理解简单指令，可能成为实现强AI的一种途径。

摘要由CSDN通过智能技术生成

所谓强AI是指和人一样能够用一种通用算法实现不同功能的AI。

现在任何有点常识的人一听到强AI，就会皱起眉头：那还是现在技术瓶颈以外的能力。但我一直在思考这个通向强AI的那把金钥匙究竟在哪里？最近突然觉得也许强AI需要的技术已经成熟，只是我们不知道怎么把现有的技术结合在一起。

计算机视觉是指通过处理视频信息，提取出摄像头周围的各种场景信息，比如什么位置有一个什么物体，有多大，我们把这些场景信息叫做地图，这个过程叫建图。因为利用这些场景信息，可以反过来计算出摄像头在场景中的位置，这个过程叫做定位。并且对于场景中的物体，还会识别他们大概是什么东西。其实这正是是人的视觉系统负责的任务：当我来到一个新的环境中时，我们环顾四周，然后来回走动一下，大概能知道周围有些什么物体，有多大，有多远，有些什么属性。然后我们就可以自如的在新环境中穿梭而不会到处碰撞。

目前计算机视觉的水平大概是：对于地图和定位的精度可以达到人的水平，并且可以分割出不同的物体。然后再结合现有识别算法，可以知道每个物体的名字。如果我们还有一套名字和属性的数据库，我们就能知道每个物体大概有些什么特点和功能。但这里的瓶颈是如果想要万能的识别任何物体，需要极其大量的人工物体标注和训练，且不说现在的算法能否支持如此大量的数据。计算机视觉方面的强AI瓶颈正式在这里。

那么这里出现了两个问题：

1，强AI是否真的需要万能的识别世界上所有的物体。

我们认为即使是才出生的婴儿的智力也是能够达到强AI的要求。但是婴儿能够识别的物体非常有限，基本就是屋里那几样东西。所以当我们把使用机器人的场景限定一下，比如只在室内，只是可移动的物体。这样需要标注和训练的量就打打减少了。其实一个成年人能够识别出无以计