干货！解释神经网络：使用信息瓶颈识别输入特征

AITIME论道

于 2022-09-18 08:30:14 发布

阅读量681

点赞数 3

文章标签：神经网络人工智能大数据算法 python

本文链接：https://blog.csdn.net/AITIME_HY/article/details/126925802

版权

本文介绍了一种名为InputIBA的新方法，它利用信息瓶颈理论在输入层识别神经网络预测中的关键特征，提供更细化的模型解释，适用于各种模型架构。这种方法解决了现有信息瓶颈方法的模糊性和特征丢失问题，提高了特征归因的细粒度和准确性。

摘要由CSDN通过智能技术生成

点击蓝字

关注我们

AI TIME欢迎每一位AI爱好者的加入！

张扬：

新加坡国立大学博士生。从事可解释性机器学习研究，以第一作者身份发表相关论文于NeurIPS，MICCAI等会议。曾在德国亚琛工业大学，慕尼黑工业大学，微软亚研院进行过研究实习。

解释黑盒神经网络的一种主要方法是特征归因（feature attribution），即识别输入特征对网络预测的重要性。最近有方法提出使用信息瓶颈（information bottleneck）模型来识别特征所包含的信息并以此衡量特征的重要性。之前的方法通常通过在神经网络内部插入信息瓶颈来识别对模型预测有意义的特征。我们提出了一种在输入空间中使用信息瓶颈并识别含有有效信息的输入特征的方法。该方法可生成比以往更加细化的模型解释，并且可以应用在任意模型架构上。

INTRODUCTION AND MOTIVATION

可解释性的重要性

即便今日的深度学习发展迅速，各种模型也比较成熟。但是神经网络依旧是一个黑盒模型，我们对其内部的结构仍然所知甚少。这样一种不可理解的特质，使得深度网络始终无法大规模部署到医疗、金融等对错误判断非常敏感的领域。神经网络不够可信的例子有很多，比较有代表性的是美国特斯拉所采用的自动驾驶系统，有过许多因识别错目标而导致的公路事故。下图即是特斯拉的视觉系统错误的将一辆翻倒的卡车识别为蓝天而导致事故。