【AI &Data Science】第 1 章分析性思维与人工智能驱动的企业

Sonhhxg_柒

已于 2022-11-01 11:41:46 修改

阅读量615

点赞数 5

分类专栏：人工智能（AI）文章标签： 1024程序员节

于 2022-10-25 08:39:35 首次发布

本文链接：https://blog.csdn.net/sikh_0529/article/details/127496901

版权

人工智能（AI）专栏收录该内容

49 篇文章 41 订阅

订阅专栏

🔎大家好，我是Sonhhxg_柒，希望你看完之后，能对你有所帮助，不足请指正！共同学习交流🔎

📝个人主页－Sonhhxg_柒的博客_CSDN博客 📃

🎁欢迎各位→点赞👍 + 收藏⭐️ + 留言📝

📣系列专栏 - 机器学习【ML】自然语言处理【NLP】深度学习【DL】

🖍foreword

✔说明⇢本人讲解主要包括Python、机器学习（ML）、深度学习（DL）、自然语言处理（NLP）等内容。

如果你对这个系列感兴趣的话，可以关注订阅哟👋

文章目录

什么是人工智能？

为什么当前的人工智能无法兑现其承诺

我们是怎么来到这里的？

数据革命

The three Vs

描述阶段

预测阶段

规定阶段

未实现的期望的故事

现代人工智能驱动型企业的分析技能

关键要点

现在是 2020 年 4 月，世界正处于一场非常严重的全球大流行之中新型冠状病毒 SARS-CoV-2 和随之而来的疾病 (COVID-19)，确诊病例数百万，死亡数十万。如果您在网上搜索AI coronavirus，您会发现一些非常有声望的媒体和学术机构都在强调人工智能（AI）在抗击疫情中可以发挥的作用（图 1-1）。

让许多人对这样的头条新闻感到不舒服的是，他们将 AI 穿上已经变得相当普遍的超级英雄套装，超出了今天 AI 所能达到的极限。

图 1-1。人工智能和冠状病毒

什么是人工智能？

如果我必须根据他们对“人工智能”一词的理解来划分世界上的人，我会说有四种类型的人。

一方面是那些从未听说过这个词的人。由于人工智能已经成为流行的民间传说的一部分，并且现在是电影、电视节目、书籍、杂志、脱口秀等的共同主题，我猜这个群体相当小。

大多数人属于第二类人，他们认为人工智能更接近从业者所说的通用人工智能（AGI）或类人智能。在他们看来，人工智能是类人机器，能够像人类一样完成相同的任务并做出决策。对他们来说，人工智能不再属于科幻小说领域，因为几乎每天他们都会遇到某种关于人工智能如何改变我们生活的媒体报道。

第三组，从业者，实际上不喜欢这个词，更喜欢使用不那么性感的词机器学习 (ML) 标签来描述他们的工作。ML 主要关注使用强大的算法和大量数据进行准确的预测。有很多这样的算法，但是机器学习技术的宠儿被称为深度学习——通过深度神经网络学习的缩写——并且几乎是该领域目前所有媒体关注的原因。

可以肯定的是，深度学习还涉及使用预测算法，这些算法已被证明在解决几年前只有人类才能访问的问题方面非常强大，特别是在图像识别和自然语言处理领域（想想 Facebook 自动标记你的朋友照片或像 Alexa 这样的虚拟助手可以让您在亚马逊上的购买体验更加顺畅，并在家中控制您的灯和其他连接到互联网的设备）。

我不想用技术细节分散你的注意力，所以如果你想了解更多关于这些主题的信息，请参阅附录。我想在这里强调的唯一一点是从业者听到或读到“AI”时会想到“ML”，而在他们的脑海中，这实际上只是意味着预测算法。

第四组也是最后一组是我称之为“专家”的人，那些从事研究并因此推动人工智能领域发展的极少数人。如今，大多数资金都用于突破深度学习领域的界限，但在某些情况下，他们正在对旨在实现 AGI 的其他主题进行重要研究。

那么什么是人工智能？在本书中，我将交替使用 AI 和 ML，因为它已成为行业标准，但请记住，除了预测之外，还有其他主题是 AI 研究领域的一部分。

为什么当前的人工智能无法兑现其承诺

人工智能的问题始于名称本身，因为它不可避免地让我们想到具有类人智能的机器。但困难不仅来自用词不当，还来自内部的评论，因为该领域的一些公认领导者强化了短期内难以实现的期望。一位这样的领导者在 2016 年声称“几乎任何普通人可以在不到 1 秒内完成的事情，我们现在都可以通过人工智能实现自动化”。其他人可能更谨慎，但他们坚信深度神经网络是实现 AGI 的基本组成部分，为媒体提供了多汁的头条新闻。

但我离题了：对于本书的目的而言，真正重要的是这种炒作如何影响了我们经营业务的方式。经常听到首席执行官和其他高级管理人员说他们正在用人工智能颠覆他们的行业。尽管他们可能并不完全了解该术语的含义，但他们仍然得到了供应商和顾问的支持，这些供应商和顾问非常乐意在泡沫破灭之前分享财富。

炒作是有风险的，因为对未实现的期望的自然反应是削减所有资金和组织重点。1我写这本书的目的是表明，虽然我们可能远未创造出类人智能，但利用当前的技术，我们可以通过将我们的公司转变为人工智能驱动的企业来创造可观的价值。为此，我们必须开始使用人工智能作为输入来提高我们的业务决策能力。

在此之前，让我们了解一下我们是如何到达这里的，因为这将有助于展示当前方法的一些困难以及已经实现的机会。

我们是怎么来到这里的？

图 1-2显示了按市值划分的全球前 10 家公司的演变。随着除了伯克希尔哈撒韦（沃伦巴菲特的企业集团）、Visa 和摩根大通，其余所有公司都在技术领域，并且都接受了数据和人工智能革命。2从表面上看，这表明如果这对他们有用，那么它必须对任何其他公司都有效。但情况是这样吗？

图 1-2。市值Top 10排名演变——（2018年之前离开排名的公司不标注）
在这些成功的背后，有两个最近才交汇的故事。一个与人工智能的发展有关，另一个与大数据革命有关。

数据革命

不久前，科技头条的女王是大数据，几乎没有人谈论人工智能（据《经济学人》报道，2017 年大数据是新石油）。让我们简单地讲述一下大数据是如何崛起的，以及人工智能是如何在近几年出人意料地抢尽风头的。

2004 年，谷歌发表了著名的MapReduce 论文，使公司能够将大块数据（不适合单个计算机）的计算分布在不同的机器上。后来，雅虎！制作了自己的开源版本的谷歌算法，标志着数据革命的开始。

技术评论员和咨询公司花了几年时间才开始声称数据将为公司提供无限的价值创造机会。起初，这场革命围绕一个支柱建立：拥有更多、多样化且可快速访问的数据。随着炒作的成熟，又增加了两个支柱：预测算法和数据驱动的文化。

The three Vs

第一个支柱涉及现在众所周知的三个 V：数量、多样性和速度。互联网转型为公司提供了不断增加的数据量。2018 年的一项估计声称，人类历史上 90% 的数据都是在前两年产生的，而且这样的计算比比皆是。如果我们想分析这种看似无限的信息供应，技术就必须适应。我们不仅需要存储和处理大量数据，还需要处理新的非结构化数据类型，例如文本、图像、视频和录音，这些数据在当时可用的数据基础设施中不易存储或处理.

结构化和非结构化数据
第二个 V，variety，强调分析所有类型数据的重要性，而不仅仅是结构化数据。如果您从未听说过这种区别，请想想您最喜欢的电子表格程序（Excel、Google Sheets 等）。这些程序以表格排列的行和列组织信息，提供大量结构，以便我们可以在用户友好的界面中有效地处理信息。这是结构化数据的一个简单示例：您可以使用行和列存储和分析的任何内容都属于此类。

您是否曾经在 Excel 中复制和粘贴图像？您不仅可以粘贴图像，还可以使用它来存储整个文本甚至视频。但是，您可以粘贴它们并不意味着您可以分析它们。而且存储效率也不高：您可以通过使用某种类型的压缩或高效格式来节省大量磁盘空间。非结构化数据集无法使用表格格式进行有效存储或分析，其中包括所有类型的多媒体（图像、视频、推文等）。现在，这些为公司提供了很多有价值的信息，那么我们为什么不使用它们呢？

在进行创新之后，顾问和供应商想出了新的方法来推销这些新技术。在大数据时代之前，企业数据仓库用于存储和分析结构化数据。新时代需要同样新的东西，因此数据湖的诞生承诺提供存储和分析大数据的灵活性和计算能力。

由于“线性可扩展性”，如果需要完成两倍的工作，我们只需要安装两倍的计算能力来满足相同的期限。同样，对于给定的任务，我们可以通过将基础设施数量增加一倍来将当前时间缩短一半。计算能力可以通过商品硬件轻松添加，由我们随时可用的开源软件有效运行。但数据湖还允许快速访问更多种类的数据源。

一旦我们解决了数量和品种问题，速度就是下一个前沿，我们的目标必须是减少行动时间和决策时间。我们现在能够在必要时实时或近实时地存储和处理大量非常多样化的数据。对于任何愿意投资于技术和专有技术的公司来说，这三个 V 很容易实现。尽管如此，财富还没有出现，因此增加了两个新的支柱——预测和数据驱动的文化——以及成功的秘诀。

数据成熟度模型
由于数据本身并不能创造所承诺的价值，因此我们需要一些额外的指导；这是哪里成熟度模型承诺帮助公司在数据革命造成的动荡水域中航行。图 1-3描述了一个这样的模型，我现在将对其进行解释。

图 1-3。显示价值创造层次结构的可能数据成熟度模型

描述阶段

从左到右，一件事从一开始就很明显：拥有更多、更好、更及时数据可以为我们的业务绩效提供更详细的视图。我们快速反应的能力肯定会让我们创造一些价值。健康类比可能有助于理解原因。

想象一下，您通过可穿戴设备或其他即将发明的内部设备在您的身体中安装传感器，为您提供更多、更好和及时的健康数据。由于您现在可能知道您的心率或血压何时升高到某个临界水平以上，因此您可以采取任何必要措施使事情恢复正常。同样，您可以跟踪您的睡眠模式或血糖水平，并相应地调整您的日常习惯。如果我们反应足够快，这些新获得的数据甚至可以挽救我们的生命。这种对过去数据的描述性分析可能会为您的健康状况提供一些见解，而价值的创造关键取决于我们足够快速反应的能力。

预测阶段

但是，当我们做出反应时，往往为时已晚。我们能做得更好吗？一种方法是将反应替换为预测行动。只要预测能力足够强大，这一层就应该为我们争取时间来寻找更好的行动，从而创造价值的新机会。

这个新阶段使我们能够开发新的数据产品，例如推荐引擎（想想 Netflix），它也催生了数据货币化的时代。在线广告业务由此诞生，标志着我们故事的一个重要转折点。营销人员的梦想实现了，承诺在正确的时间向正确的人出售正确的产品，这一切都归功于数据和由此产生的预测。

在线广告的重要性
大数据创造的财富大多是网络广告成功的产物。在线广告业务规模庞大且利润丰厚。一位消息人士估计，2023 年全球将花费超过 5000 亿美元。如果仅凭这个数字并不能说明太多，请考虑它接近比利时的国内生产总值。

该业务的两个主要参与者是谷歌和 Facebook。他们建立了自己的企业大部分资金来自这个有利可图的行业的收入，并且由于随之而来的财富，他们能够为人工智能领域最近的快速发展提供资金（多次通过收购）。

因此，可以说大数据在在线广告中的成功在促进人工智能当前的繁荣方面发挥了重要作用。

规定阶段

在这个价值创造层次中排名靠前的是我们自动化和设计智能系统的能力。我们现在处于规定层：一旦你有足够的预测能力，您可以开始为您的业务目标寻找最佳行动。这是公司从预测到优化的层，是奥林巴斯数据中的宝座，有趣的是，这是大多数成熟度模型中探索最少的一步。

未实现的期望的故事

在不到 15 年的时间里，我们经历了两次繁荣——大数据革命和当前的人工智能阶段——所以你可能想知道为什么承诺尚未兑现。

我不是数据成熟度模型的忠实拥护者，但我相信答案就在其中：大多数公司还没有到达规范阶段。大数据都是关于描述阶段的，正如我们所提到的，人工智能主要关注预测。由于在过去的几年里一切都已经为我们安排好了，关于我们明显无法前进的背后是什么的问题仍然存在。

我相信市场力量是一个重要因素，这意味着一旦炒作开始，市场参与者希望获得收益，直到完全筋疲力尽，然后再进行下一件大事。由于我们仍处于那个阶段，因此还没有前进的动力。

但是，要成为规范，我们需要获得一套新的分析技能，这也是事实。到今天为止，以目前的技术，这个阶段是由人类完成的，所以我们需要让人类准备好提出和解决规定性问题。本书旨在使我们更接近这一目标。

现代人工智能驱动型企业的分析技能

汤姆·达文波特现在经典的分析竞争（哈佛商业出版社）几乎将分析思维等同于后来被称为数据驱动的东西：“分析是指广泛使用数据、统计和定量分析、解释和预测模型以及基于事实的管理来推动决策和行动。” 另一种定义可以在 Albert Rutherford 的The Analytical Mind（独立出版）中找到：“简单地说，分析技能就是解决问题的技能。它们是使您能够以合乎逻辑、理性的方式处理问题以找出最佳解决方案的特征和能力。”

在本书中，我将分析推理定义为将业务问题转化为规范性解决方案的能力。这种能力既需要数据驱动，又需要能够理性和逻辑地解决问题，因此定义实际上与前面描述的两者一致。

为了使事情变得实用，我将业务问题等同于业务决策。其他纯粹提供信息且不需要采取行动的问题可能对某些公司具有内在价值，但我不会在这里讨论它们，因为我的兴趣是通过分析决策创造价值。由于大多数决策都是在不知道实际后果的情况下做出的，因此人工智能将成为我们接受这种内在不确定性的武器。请注意，在这种方法下，预测技术是我们决策过程的重要输入，但不是最终的。预测质量的改进可能会产生一阶或二阶影响，这取决于我们是否已经做出了接近最优的选择。

关键要点

大多数公司无法通过数据或人工智能以可持续和系统的方式创造价值：尽管如此，许多公司已经开始了自己的努力，只是为了达到失望的一面。
今天的人工智能是关于预测的：人工智能被夸大了，不仅因为它的欺骗性名称，还因为通过更好的预测可以实现的目标只有这么多。如今，人工智能最常指的是深度学习。深度神经网络是高度非线性的预测算法，在图像识别和自然语言处理领域取得了显著成功。
在人工智能之前，我们进行了大数据革命：数据革命先于当前的炒作，并伴随着产生出色业务成果的承诺。它是围绕三个 V（数量、多样性和速度）构建的，后来补充了预测算法和数据驱动的文化。
数据和预测本身无法创造可持续价值：成熟度模型表明，价值是通过以数据驱动的方式做出最佳决策来创造的。为此，我们需要数据和预测作为决策过程的输入。
我们需要一套新的分析技能才能在这个规定性阶段取得成功：当前的技术使我们无法将业务问题转化为规定性解决方案的过程自动化。由于整个过程都需要人类参与，我们需要提升我们的技能，以从数据和人工智能驱动的决策中获取所有价值。

延伸阅读
2019 年和 2020 年见证了一场非常有趣的辩论，关于通过人工智能可以实现的限制。您可以在Gary Marcus 和 Joshua Bengio 在蒙特利尔的讨论中看到这样一场辩论。如果您喜欢阅读，Gary Marcus 和 Ernst Davis 的Rebooting AI：Building Artificial Intelligence We Can Trust (Pantheon) 将提供许多细节，说明为什么许多人对深度学习作为实现 AGI 的方式持批评态度。

关于人工智能将如何影响企业的话题，我强烈推荐Ajay Agrawal、Joshua Gans 和 Avi Goldfarb的《预测机器：人工智能的简单经济学》（哈佛商业出版社）。这本书由三位经济学家和人工智能战略家撰写，提供了一个急需的、远离炒作、脚踏实地的当前人工智能的描述。他们的主要收获是，由于当前的发展，公司内部预测解决方案的成本已大幅下降，而质量却不断提高，为公司转变其业务模式提供了绝佳机会。同样由经济学家撰写的Machine Platform Crowd：Harnessing Our Digital Future由 Andrew McAfee 和 Erik Brynjolfsson（WW Norton 公司）讨论了数据、人工智能和数字化转型如何影响我们的业务、经济和整个社会。

数据成熟度模型出现在几本书中：您可以查看 Thomas Davenport 和 Jeane Harris 的Competing on Analytics（哈佛商业出版社）；工作中的大数据：消除神话，发现机遇，Tom Davenport（哈佛商业出版社）；或 Bill Schmarzo 的大数据：了解数据如何为大企业提供动力(Wiley)。

如果您有兴趣了解有关我们实现 AGI 的更多信息，请查看 Nick Bostrom 的超级智能。Paths, Dangers, Strategies（牛津大学出版社）详细讨论了什么是智能，超级智能如何出现，以及这种发展带来的危险以及它如何影响社会。类似的讨论可以在 Max Tegmark 的Life 3.0 中找到。在人工智能时代做人（复古）。

最后，在播客方面，我建议关注 Lex Fridman 的人工智能。对该领域的领导者进行了许多精彩的采访，这将为当前的事态提供更多背景信息。

Sonhhxg_柒

关注

5
点赞
踩
8

收藏

觉得还不错? 一键收藏
打赏
10
评论
【AI &Data Science】第 1 章分析性思维与人工智能驱动的企业

如果我必须根据他们对“人工智能”一词的理解来划分世界上的人，我会说有四种类型的人。一方面是那些从未听说过这个词的人。由于人工智能已经成为流行的民间传说的一部分，并且现在是电影、电视节目、书籍、杂志、脱口秀等的共同主题，我猜这个群体相当小。大多数人属于第二类人，他们认为人工智能更接近从业者所说的通用人工智能（AGI）或类人智能。在他们看来，人工智能是类人机器，能够像人类一样完成相同的任务并做出决策。
复制链接

扫一扫