大数据和人工智能的概念

大数据和人工智能的概念

概述大数据和人工智能领域的一些热门趋势。我们将看到世界如何通过数字化而改变,从而导致消费和工业领域的大数据现象;了解到数据量呈指数级增长,从太字节到艾字节再到泽字节;意识到计算机的处理能力增加了成百上千倍;讨论软件随着人工智能的应用变得更加智能,比如IBM的Watson 在《危险边缘》节目中击败人类冠军,Facebook 在照片中自动为你标记朋友,还有谷歌的自动驾驶汽车;最后阐释分析技术的类型,并介绍一个简单示例:构建由分 析驱动的系统来交付结果。

数据是新石油,人工智能是新电力

我们生活在互联网时代。在亚马逊网站上购物、通过优步打车、在Netflix 网站上刷剧,所有这些都是通过互联网实现的。在这背后,大量数据不断地从我们的计算设备上传和下载到云中的远程服务器。计算设备本身不再局限于个人计算机、笔记本计算机和移动电话。今天,我们有更多智能设备或“物”连接到互联网上,比如电视、空调、洗衣机等,且与日俱增。这些设备就像计算机一样,由微处理器驱动,并具有将数据传输到云的通信接口。这些设备可以使用Wi-Fi、蓝牙和蜂窝通信协议将数据上传到云中,还可以从远程服务器下载最新的内容,包括最新的软件更新。

物联网的出现改变了我们的生活,其现状可能非常符合10 年前的科幻小说。我们有可以根据我们的生活方式建议日常锻炼的健身手环,有可以监测心脏异常的手表,有可以收听语音指令的家用电子设备,当然还有著名的自动驾驶汽车和卡车。这些联网设备足够智能,可以分析图像、视频和音频等复杂数据,了解其环境,预测可能的结果,执行所建议的行动或指定一个行动。

Fitbit 检查我一天内的运动量是否足够,并礼貌地“要求”我起来开始锻炼。我们有传感器可以感应任何没有运动的情况,如果房间没人了,灯就会自动关闭。苹果手表4 有一个基本的心电图(EKG)功能,可以测量心脏状况。特斯拉汽车的消费者通过软件更新直接获得新功能,不需要去服务商店。现代物联网设备不仅是互联的,而且有实现一些惊人成果的智能,而这些在几年前只有科幻小说中才有描述。

物联网革命的影响如此巨大,以至于我们现在习惯于期待这样的结果。这项技术会一直存在下去。前几天,我4 岁的儿子问家里的亚马逊Echo 设备:“Alexa,你可以帮我做作业吗?”现代消费者期望设备能够提供此类新功能,任何不足都是不可接受的!

Alexa,你可以帮我做作业吗?

在这里插入图片描述

虽然结果各不相同,但这些物联网设备或“物”有一种共同模式:用传感器来“观察”环境并收集数据。这些数据可能是简单的传感器读数,如温度;也可能是复杂的非结构化数据类型,如声音和视频。有些处理是在设备端本身完成的,叫作边缘处理(edge processing)。物联网设备由于成本低,处理和存储能力通常很有限。为了进行更大规模的处理并与历史数据进行比较,这些设备将数据上传到远程服务器即云端。较新的高级物联网设备具有内置的云连接功能,可选择Wi-Fi、蓝牙或蜂窝通信协议。低功耗(和低成本)设备通常使用网关连接到云并上传数据。在云中,数据可以在更大、更快的计算机上进行处理,这些计算机通常安放在数据中心的大型集群中。此外,可以将设备数据与来自同一设备和许多其他设备的历史数据结合起来处理,这可能会产生新的、更复杂的结果,这些结果仅凭边缘处理是不可能产生的。产生的结果随后使用相同的连接选项下载回设备。这些物联网设备可能还需要通过及时的软件更新和配置进行远程管理,这也是通过云实现的。图1-2 从宏观上显示了每个级别处理数据的规模。

我们正将数十亿的智能互联设备放在互联网上。我们有智能手机录制、存储和传输太字节级别的照片和视频。监控摄像机全天候收集视频。GPS 设备、射频识别标签和健身跟踪器持续监控、跟踪和报告运动状态。我们已经把图书馆从书架“搬”到了拥有成百上千本电子书的Kindle 上。磁带和光盘转变成了MP3 格式文件,又变成应用程序,供我们下载音乐库。Netflix 使用了世界互联网带宽的15%。而这一切仅仅是消费互联网。

消费互联网上的数据量

在这里插入图片描述

机器的崛起

工业界正在发生一场并行数据的革命,其成果甚至更显著。这是一个由GE、西门子、博世等公司倡导的全新互联网,主要面向工业应用,在欧洲叫作工业互联网或工业4.0。燃气轮机、机车和核磁共振成像仪(MRI machine)等重型机械,而不是小型消费设备,被升级成智能设备并连接到互联网。这些机器通过升级先进的传感器、连接和处理能力,实现边缘分析和与工业云的连接。工业机器每天产生太字节和拍字节级的数据,比消费设备多得多。这些数据需要实时处理,以了解机器在告诉我们什么,以及我们如何提高其性能。我们需要能够通过观察传感器数据,确定一架飞机服务年限已到,不应该再执行飞行任务。核磁共振扫描仪应该具有极高的精确度,能够捕捉图像,为医生诊断病症提供足够的证据。

从图1-3 中可以清楚地看到,随着工业界中数据规模的增加,及时处理数据、生成结果日益重要。如果大家非常喜欢的《黑镜》剧集要缓冲,那么我们可以等上几秒钟。但是,医生晚几秒钟拿到核磁共振结果,对病人来说可能是致命的!

工业互联网上的数据量

在这里插入图片描述

处理能力的指数级增长

这是一场大数据革命,而我们身处其中。除非有办法及时处理数据并从中提取价值,不然这些数据没什么用。我们看到计算设备的处理能力出现了前所未有的增长,存储容量也出现了类似的增长。摩尔定律指出,由于电子学的进步,计算设备的处理能力每两年翻一番。基本上,我们可以在相同尺寸下封装两倍数量的晶体管,处理能力也随之翻倍。现代计算技术正在使这条定律变得过时。我们看到,使用先进的处理器[如NVIDIA GPU、谷歌TPU 和使用片上系统(SoC) 技术集成的专用FPGA],处理能力每年增长10~100 倍。当我们想到计算机时,它不再是桌子上有着键盘和中央处理器塔的笨重屏幕。我们在电视、空调、洗衣机、火车、飞机等设备中都安装了微处理器。数据存储量从太字节上升到拍字节再到艾字节,现在我们还有了一个描述大数据的新术语——泽字节。我们越来越擅长提升设备(边缘)的处理能力,并将更密集的存储和处理转移到云上。

数据和处理能力的增长正推动着我们改进数据分析类型。传统上,我们会按照特定的指令对计算设备进行编程,它们会毫无疑问地运行这些算法。现在我们期望这些设备更智能,并使用大数据来获得更好的结果。我们不仅仅希望预定义的规则一直运行,还希望实现之前谈到的预期结果。这些设备需要像人类一样思考。我们期望计算机通过声音和光学传感器发展出对世界的视觉感知和听觉感知能力。我们期望计算机像人类助手一样规划我们的日程——提前告诉我们汽车是否会因为发动机过热而出现问题,并像人类一样回答我们提出的问题。

一种新的分析方法

所有这些都需要在概念化和构建分析的方式上有一个全新的范式转变。我们正在从预定义的基于规则的方法转向在处理系统中构建人工智能。这些系统处理的数处理速度都在大幅增加,用于构建分析的传统算法方法已无法应对。现在我们需要专门的应用程序,迄今为止这些应用程序只能由人类大脑来完成,而不是用计算机来编程。如今,我们有计算机学习执行智能任务,甚至它们在这些任务上的表现超过人类。斯坦福大学教授、Coursera 创始人吴恩达博士有句名言:“人工智能是新电力。”在工业革命期间,正如电力影响每个行业和人类生活的每个方面,并彻底改变了一切那样,我们看到人工智能正在做着同样的事情。人工智能正影响着生活中的很多领域,并使计算机得以实现以前无法实现的结果。大数据和人工智能正在改变生活的方方面面,改变世界!

人工智能执行智能任务的示例包括识别照片中的人(谷歌Photos)、响应语音命令(Alexa)、玩视频游戏、查看核磁共振扫描结果以诊断患者、回复聊天信息、自动驾驶汽车、检测信用卡欺诈交易,等等。这些曾被认为是只有人类才能完成的特殊任务,但我们现在有了比人类做得更出色的计算机系统。我们有像IBM的Watson 这样的示例,这是一台打败人类专家的人工智能计算机。自动驾驶卡车可以在美国进行越野旅行。亚马逊Alexa 可以听你的命令、解释命令并回答,这只需要几秒钟。工业互联网也是如此。最近有许多示例,比如自动卡车和火车,发电厂转向预测性维护,航空公司能够在起飞前预测延误——可以看到人工智能推动了工业界的主要成果,如图1-4 所示。

铁道交叉口的计算机视觉人工智能

在这里插入图片描述

人工智能开始在两三年前人类没有想到的领域发挥作用。最近有消息称,一幅纯粹由人工智能创作的画售价高达432 500 美元。佳士得纽约拍卖行出售的这幅画名为“Edmond de Belamy, from La Famille de Belamy”,是由一种叫作生成对抗网络(GAN)的人工智能算法生成的。

另一个有趣的人工智能项目是由NVIDIA的研究人员完成的,目的是拍摄名人的面部图像并生成新图像。结果是一些惊人的新图像看起来非常真实,但不属于任何名人,它们都是假的。超级聪明的人工智能利用通过“观看”真实的名人照片而获得的随机数和模式,能够制造出难以辨别的假名人照片。

是什么让人工智能如此特别

想想铁道路口的监控摄像系统。它从多台全天候摄像机捕捉太字节的视频源,同步来自几台摄像机的视频,并在屏幕上显示它们以及每个视频的时间信息。现在,人类可以实时查看视频源或者回放来了解发生了什么。在这种情况下,计算机系统以正确的格式处理数据的捕获和存储,同步几个视频源并在公共仪表板上显示。它非常高效地完成这些任务,不会感到疲倦,也不会抱怨。

接下来,由人来对视频进行实际的解释。如果我们想在火车即将到达时检查是否有人穿越铁轨,就需要依靠人工查看视频,并反馈信息。类似的监视系统用于检测公共场所的可疑行为、船上的火灾危险或机场无人看管的行李。最终的分析需要由人来完成,以提取感兴趣的模式并据此采取行动。人脑具有惊人的处理能力和内置智能,每秒能够处理并解释数百幅图像,以找出感兴趣的项(人物、火等),但缺点是随着时间的推移,人类容易疲劳也容易出错。如果一名保安连续观看实时视频,他一定会感到疲倦,并可能错过重要事件。

人工智能就是把类似人类的智能构建到计算系统中。以监控视频源为例,除了显示同步的视频源外,系统还可以识别重大活动,从而构建了人工智能系统。为此,系统需要的不仅仅是大数据和处理能力,它还需要一些智能算法来理解和提取数据中的模式,并利用这些模式对新数据进行预测。这些智能算法构成了人工智能系统的“大脑”,并帮助它像人类一样执行活动。

普通的计算机系统非常擅长执行重复性的任务。它们需要用精确的指令明确编程,以便对数据执行操作,并且它们会对系统中的新数据持续执行这些操作。我们用代码编写这些指令,计算机执行这些代码无数次都没问题。现代计算系统也可以通过在多核处理器上同时运行多个作业进行并行处理。然而,每个作业仍然是预先确定的程序。这对于早期处理视频输入并在显示器上显示非常合适。只要计算资源(CPU、内存和存储)充足,就可以同时向系统提供来自数百台摄像 机的素材,系统会保持视频的格式设置并将其存储和显示在屏幕上,而不会有任何损失。我们可以将数百个视频源输入系统中,系统会很好地存储、同步,并在屏幕上显示它们。

然而,为了理解这些视频并从中提取有价值的知识,系统需要一种完全不同的能力。我们人类认为理所当然的这种能力叫作智力……但对计算机来说是件大事。智力帮助我们看视频,了解视频里发生了什么;帮助我们阅读数百页的书,并用几句话向朋友总结中心思想;帮助我们学会下棋,随着时间的推移提升棋艺。如果我们能以某种方式把这种智力推送进计算机,那么就有了速度和智能的完美结合,这能帮助我们做一些了不起的事情。以上就是人工智能的全部内容。

待续……

  • 1
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 3
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值