摘要:人工智能是如何识别图像的。李飞飞创建的ImageNet三个阶段诠释了这个逻辑过程。首先累积海量图像,其次建立算法,最后发展语意和情感。
前言
人类识别事物,大自然经过了5亿4千万年的努力才完成了这个工作, 而这努力中更多的部分是用在进化我们的大脑内用于视觉处理的器官, 而不是眼睛本身。1
一、让计算机看到全世界
首先,2009年,ImageNet项目诞生一个含有1500万张照片的数据库, 涵盖了22000种物品。 这些物品是根据日常英语单词进行分类组织的。
项目下载了接近10亿张图片并利用众包技术(利用互联网分配工作、发现创意或解决技术问题),像亚马逊(Amazon)土耳其机器人(Mechanical Turk)这样的平台来帮我们标记这些图片。 在高峰期时,ImageNet是「亚马逊土耳其机器人」这个平台上最大的雇主之一。来自世界上167个国家的接近5万个工作者,在一起工作帮我们筛选、排序、标记了接近10亿张备选照片。在短短七年时间内,利用 ImageNet 数据集分类物体的最高准确率从71.8%提升至97.3%,超过了人类的识别水平 。
二、模仿人脑神经网络创建算法和模型
其次,应用“卷积神经网络”
“对象识别模型”的典型神经网络里, 有着2400万个节点,1亿4千万个参数, 和150亿个联结。 这是一个庞大的模型。