导读:人类的智慧宽广而复杂。有些人类成就远远超出现今机器可达的领域,要想让机器触及这些领域,还需要一段漫长的时间。对于解决抽象问题、概念生成、情绪知识、创造力甚至是自我认知,即便是最强有力的深度学习算法,也无法在这些领域与人类智慧相提并论。
把所有这些认知能力融合到一台机器中,从而能够应对所有通用场景的人工智能称为通用人工智能。目前,通用人工智能还停留在理论阶段。
不过,当前的技术在执行特定类型任务方面取得了较大成功,这些任务过去都依赖于人类智力。我们称这类人工智能为狭义人工智能或弱人工智能。弱人工智能主要指三种能力:学习、感知和认知。
作者:大卫·卡尔莫纳(David Carmona)
来源:大数据DT(ID:hzdashuju)
▲AI能力备忘单
上图概述了本文介绍的AI的核心能力。
谈到AI的时候,客户们不停地在问:“这事儿成了吗?”在一个AI被过度炒作的世界,确实很难分清AI是幻想还是现实,是实际能力还是营销表演。
所有这些能力在今天都是真实存在的。今天的AI是真实的,成千上万的公司正在使用AI进行业务转型。关注AI未来的可能性固然重要,但是你更需要了解现在的AI能做些什么。
01 学习
▲学习——无显式编程的学习
机器学习的首要特征就是随时间学习的能力,并且不需要明确编程。和人类一样,机器学习算法通过探索与实践学习,而不是遵循一步步的指令(当然我知道有些读者是小孩子的父母,有时候你们可不希望孩子们这样)。
机器学习算法是按照学习方式分类的。当下最流行的、你的企业90%的时间可能都会采用的技术就是有监督学习。
有监督学习使用包含输入和期望输出的数据集。通过迭代优化,学习算法可以找到一个函数,对输入如何转化为输出进行建模。这个模型会被应用于训练集外的新的输入,并预测对应的输出。
找到正确的算法和参数,部分靠科学,部分靠创造力和直觉。如何将机器学习应用于这一过程本身就是个研究课题——这种技术称为自动化机器学习(AutoML)。
有监督学习算法都有相同的缺陷:它们需要大量数据。而且不是任何数据都行,它们需要同时包含输入和对应输出的训练数据,也称之为标记数据。
有时我们会有在记录系统或交互系统中存储的已经标记过的历史数据。例如,对于客户流失模型——我们可以查看流失客户的历史数据,加上客户的历史交互一起作为训练数据的输出部分。通过使用正确的算法,我们仅仅通过查看一系列的交互,就能够预测未来的客户流失情况。
然而有时我们不会如此幸运,数据并不会被标记。无监督学习算法会处理一组没有标记的数据并找出其中的结构。聚类算法是无监督学习算法中最流行的一种,它通过不同的技术,在数据中找到共性并对其分组。你可能使用这种算法对你的客户群或网页访问者进行客户细分。
其他常用的无监督学习算法有关联规则(定义数据间的关联,如购买某种特定产品的用户会对其他特定产品感兴趣)和异常检测(找出与主体数据不同的罕见或可疑部分数据)。
在其他情况下,我们完全不使用训