Understanding intermediate layers using linear classifier probes (2016)摘要

G. Alain & Y. Bengio
原文地址
https://arxiv.org/abs/1610.01644

众所周知,大多数时候神经网络模型的内部运算不可测,这篇论文提出了“linear classifier probe”来分析神经网络中间层在整个网络中的作用。由于很多神经网络用于线性分类(或者说各个神经层最终都会导入一个线性分类器中,使用一个线性函数来分析各层的作用是合理的。

论文主要研究三个问题:

  1. 当我们增加层数时,会发生什么?
  2. 如果神经网络有多个分支,信息会如何传递?
  3. 辅助损失(auxiliary losses)有用吗? 如果神经网络有多个分支,信息会如何传递? 辅助损失(auxiliary losses)有用吗?

论文从香农熵开始,提出第一个问题:给出一个含有数据(X,Y)的多层感知机,关于目标Y,中间层是否比X有更多的信息量?
答案是否。

假设上图,Y和A代表各随机变量,根据条件熵,可得:

可推论&#

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值