将因果引入机器学习是解决可解释性、稳定性的重要途径
Judea Pearl提出的人工智能三种模型依次为:关联、干预和反事实,其中干预和反事实属于因果推理范畴。
- 关联:当前绝大多数机器学习、深度学习的模型都仍处于关联阶段,包括当前的大模型。
- 干预:指去干预或者调整一个变量,观察结果变化,解决的是“因之果“的问题。
- 反事实:在干预的结果上做反向思考,找到产生这个结果的原因是什么,解决的是“果之因“的问题。
因果推断与机器
随着大数据时代的来临,机器学习技术突飞猛进,并且在人类社会中扮演越来越重要的角色。
例如,你可能已经习惯了每天使用各种搜索引擎查找信息,或者在电商网站和视频网站的推荐系统 ,以及利用谷歌、百度等网站提供的机器翻译学习外语,这些应用都离不开机器学习模型的支持。
但机器学习模型,尤其是当下流行的深度学习模型面临着域外泛化、可解释性、公平性等挑战。
例如,利用深度学习模型做图像分类时可能会根据图片中的沙漠背景立刻判断图像中会出现骆驼,这是因为它不会意识到“沙漠背景”和“骆驼出现”之间只存在相关性。
也就是说,“沙漠背景”并不是“骆驼出现”的原因。
而认识到这一点对人类来说并不难。因此,为了实现通用人工智能,机器学习算法需要具备判断特征和标签间是否存在因果关系的能力。
另外,机器学习中对因果关系的研究也一直扮演着重要的角色。
例如,在流行病学中,孟德尔随机化揭示了基因对患病概率的影响,其本质是一种基于工具变量的因果推断方法。
在研究疫苗的有效率时,双盲实验扮演着不可替代的角色。这是因为双盲实验可以衡量疫苗对免疫力的因果效应。
而近几年出现了众多利用机器学习方法解决因果推断问题的研究。这是因为机器学习模型不仅可以有效地处理复杂的输入数据(如图像、文字和网络数据),还能够学习到原因和结果间复杂的非线性关系。
如今,因果机器学习的研究在学术界可谓百花齐放,从利用机器学习模型解决因果推断问题到将因果关系添加到机器学习模型中,都会涉及因果机器学习。
而在业界,无论是像FAANG 和BAT 这样的大公司、Zalando(总部位于德国柏林的大型网络电子商城,其主要产品是服装和鞋类)这样的中型公司,还是像Causalens(一家英国无代码因果AI产品开发商)这样的创业公司,因果机器学习都在解决业务问题中扮演着重要的角色。
这意味着业界对因果机器学习人才的需求也处于一个上升期。
但是,目前高校开设的课程中很少有同时涉及因果推断和机器学习的。
这是因为因果推断被认为是统计学、经济学、流行病学的课程。而机器学习主要出现在计算机科学和数据科学的教学大纲中。
在机器学习算法在各领域取得重大成果的今天,人工智能仍然面临着挑战。如今,大规模的机器学习模型在有海量数据的条件下可以学习到复杂的相关性。但它们仍然很难像人类一样,只用少量的数据就可以学习到数据中隐含的因果关系。
让机器学习模型像人类一样,能够区分因果性和相关性是迈向通用人工智能的一个关键步骤。本书讲解了因果机器学习相关的基础知识、重要的方法和典型的应用,包括自然语言处理、机器学习可解释性、算法公平性、推荐搜索纠偏等。
人工智能和机器学习模型正在各行各业发挥着举足轻重的作用。传统机器学习往往专注于提升某个任务的预测准确能力,从而忽视了模型背后所能够揭示的更深层次的不同变量之间的因果联系,以致得到缺乏解释性的模型,更有可能做出不公平的决策,甚至在新的数据分布上表现不佳。让机器学习模型能够进行因果推断是从提高预测精度到揭示事物变化规律这一重要跃迁的关键能力。
后记
在这篇文章中,我们介绍了因果推断和机器学习的高级实践。因果推断是一种研究因果关系的方法,可以帮助我们更好地理解数据和影响因素之间的关系。在机器学习中,因果推断可以帮助我们更好地理解模型的预测结果和预测不确定性。
我们介绍了因果图模型、潜变量模型和因果机器学习模型,并讨论了它们的优缺点和应用。我们还介绍了因果推断方法,如贝叶斯网络和倾向得分匹配,并讨论了它们在因果推断中的应用。
最后,我们讨论了机器学习中的因果推断应用,如因果推断控制、因果结构学习和因果效应估计。这些应用可以帮助我们更好地理解数据和建立更可靠的机器学习模型。
总的来说,因果推断是一个重要的方法,可以帮助我们更好地理解数据和影响因素之间的关系,并建立更可靠的机器学习模型。但需要注意的是,因果推断需要领域知识和一定的数学功底,需要谨慎地应用。
转载自:https://blog.csdn.net/u014727709/article/details/134747264
欢迎 👍点赞✍评论⭐收藏,欢迎指正
一、网安学习成长路线图
网安所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。
二、网安视频合集
观看零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
三、精品网安学习书籍
当我学到一定基础,有自己的理解能力的时候,会去阅读一些前辈整理的书籍或者手写的笔记资料,这些笔记详细记载了他们对一些技术点的理解,这些理解是比较独到,可以学到不一样的思路。
四、网络安全源码合集+工具包
光学理论是没用的,要学会跟着一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
五、网络安全面试题
最后就是大家最关心的网络安全面试题板块
网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。
一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!