论文笔记:基于互信息估计和最大化的深度表示学习

本文概述了2019年ICLR会议论文,介绍了如何通过DeepInfoMax(DIM)方法结合全局和局部互信息最大化来学习深度表示。该方法结合了信息内容和统计属性,适用于不同任务,如重建和分类。它通过编码器和鉴别器的协同工作来优化表征学习过程。
摘要由CSDN通过智能技术生成

整理了ICLR2019 LEARNING DEEP REPRESENTATIONS BY MUTUAL INFORMATION ESTIMATION AND MAXIMIZATION)论文的阅读笔记

论文地址:DIM
code:代码地址

背景

  发现有用的表示是深度学习的一个核心目标,由于之前的工作已经可以有效的估计深度学习网络的输入/输出对之间的MI,作者提出最大化输入与输出全局和局部MI学习到更好的表示。作者还提到,直接最大化全部输入和编码器的输出(即全局的MI)更适合于重建性的任务,而在分类的下游任务上效果不太好。最大化输入的局部区域(例如图片中的一块)和输出的平均互信息在下游任务(如图像分类)上的效果更好。因此,互信息最大化的过程可以优先考虑全局或局部信息,文章表明,这可以用来调整学习表征对分类或重建风格任务的适用性。
  表征的有用性不仅仅是信息内容的问题,独立性等表征特征也起着重要作用。作者以类似于对抗性自编码器(AAE)的方式将MI最大化与先验匹配结合起来,根据所需的统计属性约束表示。这种方法与信息最大化优化原则密切相关,所以方法称为Deep InfoMax (DIM)。

模型

在这里插入图片描述
  图一是基本的编码器模型,我们的目标是使得向量y包含更多的有用特征,图二是训练鉴别器的过程,使用另一张图片为假样本,训练鉴别器使得它可以分开补丁的特征与向量y是否来自于同一张图片,注意,这里的鉴别器就是估计互信息时使用的神经网络,这是训练这个鉴别器的目的。

  • 13
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

一本糊涂张~

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值