Counterfactual Fairness 2021.3.12

最新推荐文章于 2024-10-19 19:58:05 发布

ocean0707

最新推荐文章于 2024-10-19 19:58:05 发布

阅读量1.8k

点赞数 1

文章标签：机器学习

本文链接：https://blog.csdn.net/weixin_46299905/article/details/114798108

版权

本文探讨了机器学习中的反事实公平性，强调预测结果在现实和反事实场景下应保持一致以实现公平。通过因果推断，文章讨论了公平性的不同定义、因果图、反事实计算步骤，并提供了实施反事实公平的算法和实例。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

概述

本文是机器学习公平性领域的文章，介绍了反事实公平。反事实公平，是指同一个体或者群体的预测结果在现实世界中和反事实世界中应该相似（仅受保护属性不同）。作者使用利用因果推断的工具制定建模公平性的框架。
本文的主要贡献是：
利用因果框架来模拟受保护属性和数据之间的关系，描述了因果推断技术如何设计公平算法，并论证了这对于正确地解决公平性的因果关系至关重要。

详述

一、背景

Let A denote the set of protected attributes of an individual,X denote the other observable attributes of any particular individual, U the set of relevant latent attributes which are not observed, and let Y denote the outcome to be predicted, which itself might be contaminated with historical biases，Y^ is the predictor.

1、公平性定义

（1）Fairness Through Unawareness (FTU)
An algorithm is fair so long as any protected attributes A are not explicitly used in the decision-making process.

（2） Individual Fairness (IF)
Given a metric d(·, ·), if individuals i and j are similar under this metric (i.e., d(i, j) is small) then their predictions should be similar:ˆY (X(i), A(i)) ≈ˆY (X(j), A(j)).

（3）Demographic Parity (DP)
P(ˆY |A = 0) = P(ˆY |A = 1).

（4）Equality of Opportunity (EO)
P(ˆY = 1|A = 0, Y = 1) = P(ˆY = 1|A = 1, Y = 1)

2、因果图和反事实

内生变量（endogenous variable）
在因果模型或者因果系统中，如果一个变量能够被该系统中的其他变量所决定或被影响，那么就称这个变量为内生变量。纯内生变量是说，这个变量可以系统中的其他变量所完全决定，理论上精确无误。那么这个变量其实也就没用了，可以被其他变量所替代掉。半内生变量是说这个变量会被系统中的其他变量所影响，但是不会被完全决定，还有一些系统外未考虑的因素。纯内生和半内生都是内生变量，之所以区别是为了理解因果关系上的差异。
外生变量（exogenous variable）
在因果模型或者因果系统中，如果一个变量独立于系统中其他所有变量，其他变量的变化不对该变量造成影响，那么就称该变量为外生变量。该系统的外生变量可能由系统外的因素所决定。要注意的是外生变量是独立于其他所有变量，所以其对立面是内生变量和半内生变量。另外如果你在模型中添加了会对外生变量产生影响的变量，那么该外生变量就不再是外生变量了。

因果上讲，外生变量是是对因变量的独立的决定因素；统计上讲，外生变量线性独立于其他自变量。
举一个造糖厂的例子，假定划定的系统内包含糖产量、天气、害虫、燃料价格等变量。我们可以假设糖产量是就是一个完全的内生变量，认为产量被天气、害虫、燃料价格这些因素完全决定。天气就是一个完全的外生变量，因为糖产量、害虫、燃料价格是不会影响到天气的。而害虫就是一个半内生变量，害虫某种程度是受天气影响的，但是不是被天气完全决定，还受到比如说农药、天敌威胁等外部因素的影响。
来自https://www.zhihu.com/question/56223861/answer/160750437

（1）We define a causal model as a triple (U, V, F) of sets

U is a set of latent background variables, which are factors not caused by any variable in the set V of observable variables;
F is a set of functions {f1, . . . , fn}, one for each Vi∈ V , such that Vi= fi(pai, Upai), pai⊆ V{Vi} and Upai⊆ U.

（2）反事实计算步骤：
外展（Abduction）：使用证据W=w来确定U的后验分布。
干预（Action）：通过用Z= z 来替换原来模型F中变量Z 的表达式，从而修改原模型F 为 Fz。
预测（Prediction）：使用修改后的模型Fz 和第一步计算出的P(U |W = w)来计算V的剩余元素上的隐含分布。