题目:Diffeomorphic Counterfactuals With Generative Models
具有生成模型的变形反事实
作者:Ann-Kathrin Dombrowski; Jan E. Gerken; Klaus-Robert Müller; Pan Kessel
**源码链接:** https://github.com/annahdo/counterfactuals
摘要
反事实(Counterfactuals)能够以人类可解释的方式解释神经网络的分类决策。我们提出了一种简单但有效的方法来生成此类反事实。更具体地说,我们执行适当的微分同胚坐标变换,然后在这些坐标中执行梯度上升,以找到被指定目标类别高度信任分类的反事实。我们提出了两种方法来利用生成模型构建这样的合适坐标系,这些坐标系要么完全微分同胚,要么近似微分同胚。我们使用黎曼微分几何对生成过程进行了理论分析,并使用各种定性和定量措施验证了生成的反事实的质量。