因果关系是通向强AI的阶梯or作用被夸大？

最新推荐文章于 2023-11-22 01:07:46 发布

AI科技大本营

最新推荐文章于 2023-11-22 01:07:46 发布

阅读量1k

点赞数

本文链接：https://blog.csdn.net/dQCFKyQDXYm3F8rB0/article/details/103397155

版权

整理 | 夕颜

出品 | AI科技大本营（ID:rgznai100）

一直以来，机器学习和统计学之间的界限就比较模糊，比如诺奖得主托马斯·萨金特就曾经说过人工智能其实就是统计学，只不过用了一个很华丽的辞藻。但同时也有人认为，机器学习和统计学并不完全互为代名词。

这里，我们先不讨论机器学习与统计学是否可以相互指代，但当前机器学习的主流是统计机器学习这一点无可否认，也就是通过大量的数据学习到一些隐藏的 patterns，得到数据之间的相关关系，进而进行目标检测、追踪、知识问答等处理。然而，统计学习也存在一些问题，比如根据统计规律得出的结论有时并不总是准确的，因此，如果可以建立起数据之间的因果联系，那么机器学习得出的结论将会更有说服力。因果关系的独特价值，使得这个词汇近年来在人工智能研究领域迅速升温，引起了更多人的关注。

因果关系仅仅是“因为”→“所以”之间的关系吗？

话说回来，从专业角度来讲，因果关系究竟是什么样的关系？就是我们平常所理解的那种“因为所以，科学道理”这样的关系吗？AI 科技大本营邀请到卡内基·梅隆大学哲学系（机器学习系兼职）副教授，德国马克思普朗克智能系统研究所高级研究员张坤，来为我们解答关于因果关系的疑问。

张坤解释道，通俗地讲，科学研究中的因果关系与我们生活中所说的因果关系是一回事。比如我们平时所说的天下雨导致地上湿就是一个典型的因果关系的例子。因果关系抽象出来的定义是这样的——如果保持系统中其他变量都不变，只改变其中的一个变量（比如通过人工降雨来让天下雨），然后发现有另一个变量也随之改变（比如我们发现地上由干变湿了），那么我们就说前面一个变量（是否下雨）是后一个变量（地上是否湿）的一个原因。一个典型的因果模型可以通过直观的图模型来描述，或者通过从因到果的数学函数来刻画。

因果与机器学习的结合将带来突破

实际上，因果关系已不是一个新鲜词汇，长期以来都有相关的研究在悄然进行着，比如张坤正在进行的因果机器学习研究。

据张坤介绍，因果机器学习的研究范畴主要包含三个方向。第一个方向是如何从观测数据中找到背后的因果关系，这就需要用到数据分析或者机器学习的手段。一个典型例子是如何通过分析人脑的功能性核磁共振（fMRI）信号来得到各脑区之间的因果连接。近年来，研究者越来越关注更实际的机器学习或者人工智能问题，比如如何在变化的环境中做迁移学习，在这类问题中研究者需要找到并且利用数据产生过程的性质；而因果关系对数据背后的过程提供了一个很自然的描述。相应地，第二个研究方向就是如何利用因果的思维方式解决更复杂更实用的机器学习问题。第三个研究方向是在已经给定了因果图结构和观测到的数据的前提下如何估计一个变量对另一个变量的因果影响（比如某种新药物对治愈率的影响），这是传统的研究方向之一，受到统计学界很多人的关注。在机器学习领域，大部分人更关注前两个研究方向。

从中可以看到，因果关系可以应对更复杂的环境，那么，它可以帮助解决哪些复杂环境下的机器学习问题？可以改善机器学习研究中的哪些现存弊端？以及可以达到较好效果的原因和其背后的运行机制是什么呢？

张坤反问道，人类为何自发地习惯于因果的思维方式？我们有时需要有的放矢地改变这个世界，这当然需要因果的认识；更多情形下，因果的思维方式帮助我们把眼前复杂的世界分解成各个相互没有联系的模块，从而简单地分而治之；否则，沉醉于万物皆有联系、牵一发而动全局的想法，就很难主动地去做好的预测或干预。在机器学习领域亦是如此，只要机器学习的问题脱离了传统的数据独立同分布假设，因果的思维方式就可以很自然地帮助我们来理解、应用数据背后的规律来解决问题。这可以改善传统机器学习对训练数据过度依赖的问题。

这类问题包括迁移学习、半监督学习、有标签噪声的学习、强化学习，以及如何处理对抗攻击。张坤表示，在这类问题中，不能以简单的方式完全依赖训练数据，而因果的思维方式可以让我们理解数据背后的产生规律并为之建模，从而针对待分析数据或待解决的特定问题，我们能得到更有适应性或者更恰当的模型。

因果关系是实现通用人工智能的阶梯

贝叶斯网络之父朱迪亚·珀尔曾在因果关系科普著作《为什么》中说道，“沿着因果关系之梯，机器便有望拥有强人工智能”，强调了因果关系在实现机器智能过程中的重要性。因果关系真的是通向通用人工智能的阶梯吗？它在实现通用人工智能上的真正作用和意义是什么？

张坤认为，实现通用人工智能的困难至少有两点。第一点是如何让智能系统学习出整个的环境的性质、它的行为如何与环境交互，并且有能力恰当使用这些学习出来的规律。环境包括所有需要处理的问题以及所有可能见到的场景，而学习出来的规律需要把这些问题、场景、以及行为内部以及之间的联系表述出来。第二点是需要把“通用”给界定出来——我们希望人工智能系统处于什么环境？处理哪些问题？问题的范畴是什么？我们对身处的世界以及其中要解决的问题习以为常，但人工智能系统跟我们的构造、输入、产生方式都不一样，我们需要为智能系统提供一个环境。

为实现通用人工智能，因果关系至少有两方面的用途：第一，上面所提到的学习出来的规律往往是因果关系，因为因果关系一般为环境提供了一个紧凑的描述；第二，智能系统要处理的很多问题本身就是因果问题，比如要做什么做才能把一瓶水打开，要解决这些问题就必须认识到事物之间的因果联系。

因果关系在机器学习领域最新研究和应用

因果关系与解决迁移学习、弱监督学习、强化学习

当前，因果关系在机器学习上已经有了不少进展，包括如何理解以及解决迁移学习、弱监督学习、和强化学习问题。

张坤表示，他所在的团队在这三类问题上都有涉猎，也做出了一些值得思考的结果。这两年来，张坤团队在试图解决一些更实用，同时也比较有难度的问题。第一个问题是如何从观察到的数据发现背后的隐变量以及它们之间的关系，比如如何通过分析大量图片来找出背后各种概念（如树、人、大海、身体、四肢、皮毛、车、轮子等）和它们之间的关系。

从因果发现的角度来看，观测到的变量往往是背后有意义的隐变量或者概念的反映，所以张坤团队转变了兴趣点——传统的因果发现往往着眼在寻找观测变量之间的因果关系，而他们更在意观测变量背后的隐变量以及它们之间的关系。“从机器学习的角度来看，这为非监督深度学习以及非模型强化学习提供了新的思路和实现方向”，张坤说道。

第二个问题是在如何在深度学习系统中防止对抗攻击。要解决这个问题，在某个程度上，需要让机器具备类似于人类的决策过程；否则，我们一定可以以特定方式改变系统的输入，从而使得在人类的认知不变的前提下，而让机器的决策改变。

因果关系与小数据驱动

大家都知道，机器学习严重依赖于大量数据，但是近年来，由于数据隐私等问题变得日益严重，使用大量数据过程中会遇到各种各样的麻烦，于是，小数据驱动的研究方向开始引起研究者们的兴趣。小数据涉及知识、推理、判断，这些都是这代人工智能最大的短板，如果在这个方向上有所突破，或许会为人工智能研究打开一个新的思路。那么，小数据驱动的方法有难度吗？目前还面临着哪些问题？

对此，张坤表示，人类的决策系统通常可以游刃有余地恰当使用小数据，打个比方，在中国开车靠右行驶（左驾），到英国，我们只看几眼，就能推断出他们开车靠左行驶（右驾），以及右侧超车。这个能力需要我们理解驾车规则内部以及规则与汽车结构之间的不变性和可变性。对机器来说，小数据驱动的方法当然比传统的完全基于数据的学习方法更难一些——为了使机器具备与人类似的小数据驱动能力，我们需要让机器有能力去表述、学习和使用事物内在的不变性以及变化的性质。这种表述手段以及学习和使用的方式就是小数据驱动的难点所在。相应地，张坤团队近期的研究方向之一，就是如何从非平稳数据中找到因果关系或者数据变化的规律，并正在拓展这个方向的工作，使得系统具备自动发现有意义的隐变量的能力。张坤认为，这个研究方向或许为小数据驱动学习提供了一些可能的思路。

因果关系在机器学习/通用人工智能领域的潜力

因果关系研究和应用的潜力从中可见一斑，未来，它在机器学习和通用人工智能领域中的应用还有哪些想象空间呢？张坤也给出了他的预测：将来机器和人应该可以无缝交流和协作。它们可以自然地学习各种因果关系或者精炼的联系，自如地回答人类各种有关“为什么”的问句，在需要它们的领域自发、自动地解决各种设定或突发的问题，并且它们的知识有可能给人类启迪。

“因为机器与人构造不同，输入方式相异，各种能力的限制也有明显差异，它们应该可以帮助我们耐心、专注地完成我们需要的工作，显著地扩大我们的世界，也给予我们更多的自由和乐趣。”张坤畅想道。

以人为本，预防“多数暴政”

而对于因果关系和通用人工智能的未来，张坤持谨慎乐观态度：“因果关系或者类似的精炼关系会更容易学习和使用，智能系统会更自洽，与我们的交流会是双方受益，身体或心理上需要照顾的人也会生活得更有尊严。以人类为中心来看，这样的世界有些接近历史上的乌托邦，不同之处是，因着智能系统的辅助，它可被实现。”

但是在这个过程中，张坤强调一定要确保以人为本。“使用系统时，要明确哪些人群和行业受益，哪些可能受到伤害，以及受益或伤害的点在哪里，对人工智能系统的建立和使用一定要有必要的、透明的立法和监管。人工智能的使用必须要预防'多数暴政'。一部分人，或者大部分人在享受人能智能带来的便利时，不应坐视它为少数人可能带来的不便。比如打车软件方便了很多人，但同时，若没有尊重少数人的意识，对那些没有国内银行卡，或者没有安装软件，甚至不使用手机的人来说，他们可能突然遇到打车困难，这对他们很不公平。”

“对人类来说，不管技术多强大，它也是工具。只要是工具，就应该注意它的使用目的和使用方式，”张坤的这番话道出了技术的本质，无论 AI 最终拥有多么强大的能力，从根本上来说，它应该是一个服务于人的工具，就像智能手机应该是我们的交流和通讯工具，而不是反过来被它奴役。

想要更多精彩内容，来BDTC 2019吧！

看到这里，相信大家对于因果关系这个 AI 领域最近火起来的概念有了一些了解，想要了解更多关于因果关系相关最新研究成果和应用吗？这里就有一个不容错过的机会。

2019 年 12 月 5 日至12 月 7 日，在北京长城饭店举办的 2019 中国大数据技术大会（BDTC 2019）的大数据时代的因果推断论坛上，张坤教授将带来更加详细的解读，并与更多来自海内外著名高校与企业的科学家一起，交流大数据因果推断的算法理论、技术平台设计以及应用。

因果推断，AI研究的热潮

时间：2012 年 12 月 6 日 9:00-12:00

论坛主席：宫明明，墨尔本大学数学和统计学院讲师、博士生导师

长期从事人工智能与数据科学方面的的科研工作。其研究方向主要集中于从大数据中发现因果关系以及基于因果模型进行高效的迁移学习和弱监督学习。担任美国自然科学基金委(NSF)信息与智能学科评审专家，国际人工智能会议AAAI高级程序委员，以及10多个CCF A类会议和期刊的程序委员与审稿人。在人工智能与大数据的顶级会议及期刊，例如NeurIPS、ICML、CVPR、 AAAI上发表论文30余篇。

此外，本论坛主席宫明明还邀请到数位来自大数据因果推断研究前沿的工业界和学术界专家，他们分别是：

张坤，卡耐基梅隆大学哲学系（机器学习系兼职）副教授，同时担任德国马克思普朗克智能系统研究所高级研究员。他的主要研究方向是机器学习和人工智能，特别专注于因果发现和因果机器学习的研究。在机器学习顶级会议和期刊发表论文100余篇, 并担任如NeurIPS，ICML等多个顶级会议的领域主席。

演讲议题：因果关系和通用人工智能

演讲简介：抽烟导致肺病吗？我们能通过分析两个变量的观测值找出它们之间的因果关系吗？在我们的日常生日和科学研究中，为了理解以及恰当的控制系统，人们常常试图回答这样的因果性问题，而过去几十年，在机器学习、统计和哲学领域的都有一系列相关进展。另一方面，我们经常遇到复杂环境下的机器学习问题。比如，非平稳环境下我们如何做最优预测？我们如何达到所谓的通用人工智能？有意思的是，最近几年我们发现因果性能帮助和理解一系列机器学习问题，包括迁移学习和半监督学习。这个报告着眼在如何从被动观测数据中找出因果关系，为何因果性可帮助解决机器学习问题，以及如何实现。最后，我会讨论因果描述与通用人工智能关系何在。

陈志堂，华为诺亚方舟实验室主任工程师，2010 年本科毕业于中山大学自动化系，2014 年在香港中文大学计算机科学与工程系获得博士学位。现为华为诺亚方舟实验室主任工程师。其研究兴趣包括核方法，深度学习，因果推理，强化学习，多智能体系统以及上述研究在通信网络的应用。

演讲议题：基于强化学习的因果结构发现

议题简介：从观测数据中发现变量之间的因果关系是很多科学研究的基础问题。基于评分的传统算法通过局部启发式算法搜索有向无环图，然而这些算法效果并不令人满意。受到近年来神经组合优化算法的启发，我们提出了一种基于强化学习的方法搜索最佳评分的有向无环图。我们提出的自编码-解码模型，输入观测数据输出因果图的邻接矩阵，并得到对应的评分作为强化学习的奖赏信号，用于更新强化学习搜索策略。合成数据和真实数据实验，证实了我们提出的强化学习搜索策略的有效性。

宋雨伦，联通大数据首席技术官兼数据科学家，宋雨伦博士是一名软件工程科学家，数据科学家。他于2015年获得格拉斯哥大学计算科学学院博士学位。目前任职于中国联通集团全资子公司联通大数据有限公司，任职CTO、首席数据科学家。他目前的工作重点是将软件工程理论知识应用在数据科学应用研发领域，并深入探索海量运营商数据服务民生、政务、经济等领域。宋雨伦博士于2017年被中国软件行业协会授予年度优秀CTO。2018年入选中国食品药品监督数据中心大数据领域专家。同时也积极参与数据科学学术研究，并入选中华人民共和国工信部大数据行业委员会专家。国家电网大数据中心特聘专家。持有CMMI所颁发的数据成熟度管理模型认证证书。同时担任联通集团科技委主任专家，北京理工大学计算机学院国家自然语言处理重点实验室企业导师，工信部信通院数字产业发展联盟数字经济组副主席，CCF大数据专家委员会委员。中国电力大数据创新联盟专家委员会专家。

演讲议题：探寻大数据价值背后的因果关系是必须的吗？

议题简介：大数据的思维方式对行业推进带来了更多的可能性。议题从“啤酒尿布”这个老故事切入，具体的剖析了其背后的商业价值与反应的社会问题，进而展开大数据的价值探讨，即：价值是相对的，关联到因果只是虚拟世界物理化不同程度的表现，虚拟世界的采样正是为了物理世界的还原。而物理世界的虚拟化正如Nyquist采样一样让计算机帮助人类去理解复杂的物理世界。议题后半部分会结合实例重点介绍运营商大数据是如何为行业带来更丰富的决策依据。

刘春辰，NEC中国研究院数据分析部部长，女，计算机博士，研究方向包括因果推断、贝叶斯网络、贝叶斯推断、可解释模型、语义分析、优化控制等。致力于自动机器学习平台的搭建、运营，并在市场营销、零售、制造等垂直领域有着丰富的应用实践经验。

演讲议题：因果网络发现技术及其应用

议题简介：探索事物之间的因果关系、发现因果网络并量化因果作用，不仅是很多科学研究的重要目的，也是优化众多垂直领域工业实践的必要技术。那么，因果能够具体应用于哪些工业实践？而在利用因果技术指导工业优化过程中，又会遇到哪些问题？什么样的因果技术具备更强的实战价值？让我们一起分享、讨论因果及其应用那些事。

董振华，华为诺亚方舟实验室高级研究员，研究方向为推荐系统、反事实学习、移动计算，近年来专注反事实学习在推荐系统中的研究和应用。董博士致力于应用先进的机器学习技术为用户创造价值，其团队研发的推荐系统技术已经落地到华为应用市场、信息流、服务直达、广告CTR预估等场景，在提升用户体验和平台收入的同时，产出了20篇相关高水平论文和19篇专利，并在KDD、SIGAPP等顶级会议担任程序委员会成员，曾担任KDD、TOIS、ICDM、SAC的审稿人。董博士本科就读于天津大学，博士毕业于南开大学计算机系，曾作为访问学者在明尼苏达大学GroupLens实验室访问交流一年。

演讲议题：基于反事实学习的推荐系统研究

演讲介绍：推荐系统中，理想的用于学习模型的样本是：将所有的候选物品机会均等地展示给用户，从而消除数据偏置和前序模型偏置带来的影响。但真实的工业级产品由于海量物品和用户的限制，无法应用如上的方法。为了解决这个问题，我们研发了2种反事实学习技术和框架，引入未观测样本和具有非偏性质的数据进行学习，通过在真实数据上的实验，证明所述方法的有效性。最后探讨因果推理和反事实学习技术在推荐系统中的研究方向和个人体会。

更多嘉宾还在确认中，以最终到场嘉宾为准......

除了主论坛之外，由大会主席团组成的组委会还精心策划了 15 场专题技术和行业论坛，包括新一代数据库转型、人工智能赋能金融科技、AutoML大数据自动化机器学习技术与系统等。

作为大数据领域极具影响力的行业盛会，BDTC 已成功举办十二届，见证了大数据技术生态在中国的建立、发展和成熟。本届大会将汇聚学术界和工业界的百余位专家，聚焦智能时代，大数据技术的发展曲线和大数据与社会各行业相结合的最新实践进展。

开幕式倒计时1天，大会全议程出炉！

开幕倒计时 1 天！2019 中国大数据技术大会（BDTC）即将震撼来袭！豪华主席阵容及百位技术专家齐聚，十余场精选专题技术和行业论坛，超强干货+技术剖析+行业实践立体解读。

‍

仅剩一天时间，扫描下方二维码购票或戳阅读原文了解大会详情~

AI科技大本营

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
因果关系是通向强AI的阶梯or作用被夸大？

整理 | 夕颜出品 | AI科技大本营（ID:rgznai100）一直以来，机器学习和统计学之间的界限就比较模糊，比如诺奖得主托马斯·萨金特就曾经说过人工智能其实就是统计学，只不过用了...
复制链接

扫一扫