新加坡国立大学冯福利：因果推理赋能推荐系统初探

AITIME论道

于 2020-10-29 19:56:39 发布

阅读量3.1k

点赞数 2

文章标签：人工智能大数据算法编程语言 python

本文链接：https://blog.csdn.net/AITIME_HY/article/details/109376932

版权

冯福利博士在报告中探讨了因果推理如何增强推荐系统，特别是如何利用反事实推理技术消除数据偏差。他指出，大多数机器学习模型仅关注关联性，而忽视了因果关系。在推荐系统中，数据偏差如流行度偏差和点击诱饵偏差影响模型性能。通过反事实推理，可以估算偏差影响并改进推荐结果，提高模型的准确性和用户体验。

摘要由CSDN通过智能技术生成

⬆⬆⬆ 点击蓝字

关注我们

AI TIME欢迎每一位AI爱好者的加入！

2020 年 9 月 25 日，在由中国科协主办，清华大学计算机科学与技术系、AI TIME 论道承办的《2020 中国科技峰会系列活动青年科学家沙龙——人工智能学术生态与产业创新》上，新加坡国立冯福利博士进行了题为《因果推理赋能推荐系统初探》的主题报告，介绍了因果推理技术的实用价值，重点分析了其团队在利用反事实推理技术消除数据偏差方面的相关工作，并对因果推理研究未来的发展趋势进行了讨论。

图 1：因果推理赋能推荐系统初探

因果之梯

如图 1 所示，著名的贝叶斯网络之父、图灵奖获得者 Judea Pearl 将人类的智能划分为了三个层次（即「因果之梯」）：Seeing、Doing、Imaging。Pearl 将第一层智能归纳为「关联」（Association），即观察数据并发现其中的关联关系。例如，如果我们观察超市的销售记录，可能会发现对某一种商品采取打折促销手段会导致销量上升，即发现打折和销量上升之间的关联关系。

图 1：第一层智能——「关联」

第二层的认知能力为「干预」（Intervention）。在观察销售记录的过程中，我们发现销售记录只记载了「洗发水打 5 折会导致销量上涨 20%」，但是并没有沐浴露打折对销量影响的记录。实际上，我们在进行决策时候可以推断：由于沐浴露和洗发水十分相似，如果我们对沐浴露打 5 折，可能也会增加 20% 的销量。

图 2：第二层智能——「干预」

在「因果之梯」的最上层，还具有一种认知能力——「反事实」。我们可以推测一些跟历史数据不一致的情况，预测在假定面对与现实不同的情况下会产生怎样的结果。在第二层智能「干预」中，我们可以很容易地将「洗发水打折对销量有有所提升」的结论泛化到沐浴露上。但是如果我们想要预测在打 7 折的情况下销量会增加多少，就无法简单地将历史数据泛化到目标任务上了，我们需要知晓打折和销量增加背后究竟有怎样的关系。

图 3：第三层智能——「反事实」

目前，大多数的机器学习模型只关注到了智能的「关联」层面，即学习出训练数据中的特征与标签之间的关联关系，但这种智能化程度仍然是远远不够的。

因果推理应用示例

图 4：巧克力消费量 vs 获诺贝尔奖数量

如图 4 所示，横轴代表各国巧克力的消费量，纵轴为该国家每 1000 万人口中诺贝尔奖得主的数量。不难发现，该图表明巧克力消费量和获诺贝尔奖的数量是高度相关的。那么问题来了：如果我们能否根据这些特征及其之间的相关性构建一个模型，预测某个国家未来会获得多少诺贝尔奖？由于图 4 显示巧克力消费量与获诺贝尔奖数量正相关，这个思路看起来似乎是可行的，该模型会认为巧克力消费量很大的国家可能获得的诺贝尔奖也很多。那么，该模型何时会失效呢？例如，假设某些获诺贝尔奖可能性很大的发达国家的人民突然间注意到了肥胖问题，而吃很多巧克力也许会导致肥胖，此时这些国家的巧克力消费量可能就会下降。如果我们再用之前的模型预测获诺贝尔奖的数量，结果将会不够准确。

该模型为什么会失效？从数据上看，历史数据告诉我们，巧克力消费量和诺贝尔奖的获得数量是高度相关的。但是，其背后的原因可能是：在过去的几十年中，收入较高的国家对于教育、科研的投入可能更大，因此就获得了更多的诺贝尔奖。同时，收入较高的国家可能也会消费更多巧克力，所以才导致巧克力的消费量与获得诺贝尔奖的数量在表面上有高度的正相关性。然而，如果收入高的国家的国民出于健康考虑，不再吃更多巧克力，这种相关性就会产生改变。