β-TCVAE (Isolating Sources of Disentanglement in Variational Autoencoders)

论文:https://arxiv.org/pdf/1802.04942.pdf

摘要:

论文将 ELBO(evidence lower bound)分解成多项,用于调整隐变量之间的关系,提出 β-TCVAE 算法,是 β-VAE 的加强和替换版本,并且在训练中不增加任何超参数。论文进一步提出 disentanglement 的规则的无分类方法 MIG( mutaul information gap)。

介绍:

论文主要做了四个贡献:① 分解 ELBO, 解释 β-VAE 的成功之处 ② 提出一个方法:基于随机训练中的权重采样,且不增加任何超参数 ③ 引入 β-TCVAE 发现更多可解释隐变量,在随机初始化情况下具有更强的鲁棒性 ④ 从信息论视角处理 disentanglement ,无分类器和可生成随机分布和无标准分布的隐变量。

背景:

① VAE 提出一对隐变量模型,顶层的 generative 生成模型和底层的 inference 推断模型,VAE 没有直接求解 likelihood estimation (似然估计),由于该 likelihood 很难直接求解。VAE 的训练是直接由优化 ELBO 进行的,以下是核心方程:

decoder 和encoder 由深度神经网络调整参数,同时在 VAE 的论文中为了更好的求解使用再参数化的技巧,引入高斯分布,此处不再赘述。

② β-VAE 在 VAE 的基础上增加了一个惩罚项,核心方程如下:

在 β-VAE 的论文中指出,如果 p(z) 是因子(阶乘)的,隐变量表示会变得更加独立。但是 β-VAE 没有明确为什么在 KL 散度项(公式中右边第二项)中加入惩罚因子会使得学习隐变量变得更加 disentangled。

③  InfoGAN 是 GAN (generative adversarial network)的延伸(变种),GAN 通过最大化探索数据和小部分隐变量之间互信息来增强隐变量的表示。

ELBO分解:

将 KL 散度公式分解成如下表达方式

分析上述分解式:① index-code MI 表示在经验上的分布 q( z, n )的变量和隐变量之间的互信息,可以看做在 p(x) 和 q(x)持续且偏置的估计, index-code MI 的期望是一个下届。 p(n) 是一个经验分布,更高的 index-code MI 会在分辨经验采样有更好的效果。② 表示 total correlation ( TC ),TC 作为惩罚使得模型在分布中寻找统计独立性因子,更重的惩罚(TC 的值越大)引起更大的 posterior 后验学习分布中语义的统计独立性,这其中会包括更加 disentangled 表示。③ dimension-wise KL 阻止独立变量太偏离它们所对应的先验分布。

β-VAE 分析:

β-VAE 在传统的 ELBO 中的 KL 散度项添加了惩罚项,鼓励更低的 total corelation 但同时也惩罚了 index-code MI. 更低的 total corelation 是 β-VAE 表现优异的核心所在。

使用小样本权重采样:论文提出一个方法来随机估计分解项,可以分别使得每一个分解项都可以测量。

上述公式计算需要整个经验数据,但是这在训练中是不希望发生的。论文提出的方法没有增加超参数或者内部更多的优化方法环路。传统的蒙特卡洛近似基于 p(n) 的采样经常会 过低估计 q(z). 比如 n 取样自 z 时, q(z|n) 接近0, 而正确的值应该很大。因此,论文借鉴重要性采样的思路,训练时,估计函数 logq(z) 时使用权重,公式如下:

因为原期望是一个下届,所以这个估计是偏置的。

β-TCVAE公式:

在论文中使得,调整β的值进行调训练。

通过MIG评估 disentanglement:论文提出了一种新的在隐变量和分类准确性的基于经验的互信息标准 empirical mutual information (MIG),在隐变量 z 和分类标准准确性因素 vk 中的 MIG 可以使用联合分布:

进行估计,并且假设和生成方式对经验数据已知。则:

通过求得两个变量之间最大的互信息来加强轴间校准,公式可以转化为:

上述公式的第一项与因素的旋转有关,如果隐变量不是轴向排列的,每个变量可能包含更多的信息,可能会被认为是两个或者更多的因素。第二项与表示得简洁度有关,如果一个隐变量是基于某一个因素的,其他变量就不必也关联这个因素了。

下表对比了各个不同的标准的优劣势:

结论:β-TCVAE相对与 β-VAE效果更好,并且不增加多余的网络结构和超参数。

 

  • 4
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
数据来源:中经数据库 主要指标110多个(全部都是纯粹的 市辖区 指标),大致是: GDP GDP增速 第一产业增加值占GDP比重 第二产业增加值占GDP比重 第三产业增加值占GDP比重 人均GDP 社会消费品零售总额 固定资产投资(不含农户) 新设外商投资企业数_外商直接投资 实际利用外资金额(美元) 一般公共预算收入 一般公共预算支出 一般公共预算支出_教育 一般公共预算支出_科学技术 金融机构人民币各项存款余额_个人储蓄存款 金融机构人民币各项存款余额 金融机构人民币各项贷款余额 规模以上工业企业单位数 规模以上工业企业单位数_内资企业 规模以上工业企业单位数_港澳台商投资企业 规模以上工业企业单位数_外商投资企业 规模以上工业总产值 规模以上工业总产值_内资企业 规模以上工业总产值_港澳台商投资企业 规模以上工业总产值_外商投资企业 规模以上工业企业流动资产合计 规模以上工业企业固定资产合计 规模以上工业企业利润总额 规模以上工业企业应交增值税 规模以上工业企业主营业务税金及附加 户籍人口数 年均户籍人口数 户籍人口自然增长率 第一产业就业人员占全部城镇单位就业人员比重 第二产业就业人员占全部城镇单位就业人员比重 第三产业就业人员占全部城镇单位就业人员比重 城镇非私营单位就业人员数 城镇非私营单位就业人员数_第一产业 城镇非私营单位就业人员数_第二产业 城镇非私营单位就业人员数_第三产业 城镇非私营单位就业人员数_农、林、牧、渔业 城镇非私营单位就业人员数_采矿业 城镇非私营单位就业人员数_制造业 城镇非私营单位就业人员数_电力、热力、燃气及水生产和供应业 城镇非私营单位就业人员数_建筑业 城镇非私营单位就业人员数_批发和零售业 城镇非私营单位就业人员数_交通运输、仓储和邮政业 城镇非私营单位就业人员数_住宿和餐饮业 城镇非私营单位就业人员数_信息传输、软件和信息技术服务业 城镇非私营单位就业人员数_金融业 城镇非私营单位就业人员数_房地产业 城镇非私营单位就业人员数_租赁和商务服务业 城镇非私营单位就业人员数_科学研究和技术服务业 城镇非私营单位就业人员数_水利、环境和公共设施管理业 城镇非私营单位就业人员数_居民服务、修理和其他服务业 城镇非私营单位就业人员数_教育 城镇非私营单位就业人员数_卫生和社会工作 城镇非私营单位就业人员数_文化、体育和娱乐业 城镇非私营单位就业人员数_公共管理、社会保障和社会组织 城镇非私营单位在岗职工平均人数 城镇就业人员数_私营企业和个体 城镇非私营单位在岗职工工资总额 城镇非私营单位在岗职工平均工资 城镇登记失业人员数 建成区面积 建设用地面积 建设用地面积_居住用地 液化石油气供气总量 液化石油气供气总量_居民家庭 人工煤气、天然气供气总量 人工煤气、天然气供气总量_居民家庭 液化石油气用气人口 人工煤气、天然气用气人口 城市公共汽电车运营车辆数 城市出租汽车运营车辆数 城市公共汽电车客运总量 道路面积 排水管道长度 建成区绿化覆盖面积 建成区绿化覆盖率 绿地面积 公园绿地面积 维护建设资金支出 土地面积 生活用水供水量 供水总量 全社会用电量 城乡居民生活用电量 工业生产用电量 房地产开发投资 房地产开发投资_住宅 限额以上批发和零售业法人单位数 限额以上批发和零售业商品销售总额 普通中学学校数 中等职业教育学校数 普通小学学校数 普通高等学校专任教师数 普通中学专任教师数 中等职业教育专任教师数 普通小学专任教师数 普通高等学校在校生数 普通中学在校生数 中等职业教育在校生数 普通小学在校生数 电视节目综合人口覆盖率 公共图书馆总藏量_图书 医疗卫生机构数_医院和卫生院 卫生人员数_执业(助理)医师 医疗卫生机构床位数_医院和卫生院 城镇职工基本养老保险参保人数 职工基本医疗保险参保人数 失业保险参保人数

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值