卑微且强大的Gumbel分布

GAN从诞生开始,广泛应用于计算机视觉领域,并取得了巨大地成功,相比而言,GAN在NLP领域的应用还是相对较少,这是因为GAN对离散型数据序列的处理显得无能为力,从离散分布中采样的数据时不可导的,在使用梯度下降算法时,无法正常更新模型中参数,Gumbel-softmax分布成功地使GAN摆脱了这个困境,为GAN在NLP领域地发展奠定了基础。文本数据是离散数据,可以使用one-hot编码来进行表示,可对softmax函数的输出(其输出接近于one-hot编码)进行采样,选取最大概率对应的词作为生成词,但是,这种采样过程是不可微的,无法通过反向传播梯度,于是采用Gumbel-softmax,并对其采用可以得到一个可微的近似值。
因此本文将对Gumbel分布、Gumbel-max以及Gumbel-softmax进行总结。

Gumbel分布:

p ( x ) = 1 β e x p ( − z − e x p [ − z ] ) p(x)=\dfrac{1}{\beta}exp(-z-exp[-z]) p(x)=β1exp(zexp[z])

其中 z = x − μ β z=\dfrac{x-\mu}{\beta} z=βxμ

Gumbel分布通常用于对一组独立样本地最大值进行建模。假设您对冰淇淋的饥饿感呈正态分布,平均值为 5/10。你每天记录你的饥饿 100 次,持续 10,000 天。(我们还假设您的饥饿感非常不稳定,以至于所有样本都是独立的。)您记下您每天经历的最大饥饿感。然后,每日最大饥饿值的分布将遵循 Gumbel 分布。

Gumber Trick

Gumber Trick用于从离散分布中进行随机采样,可以采用对一个可微分的分布取样来近似从离散分布中取样,
Gumber-softmax所得到的概率向量是近似的样本,Gumber-softmax得到的概率向量与真实样本的相似度就由 τ \tau τ的大小决定,当 τ \tau τ越小,其相似度越高,当 τ \tau τ越大,就接近于n-class的均匀分布,常用于需要对离散分布进行采样,而且还希望采样是可导的;
在这里插入图片描述
softmax得到的概率分布是样本的均值(也就是取概率最大的词)此时的均值与真实样本的差距一般都比较大

reparameterization trick :常参数本质是希望将带训练参数从分布转移到样本之中,这样求参数的梯度就可以通过对样本求梯度来完成。常用于处理如下目标函数的期望:
L θ = E z ∼ p θ ( z ) [ f ( z ) ] L_{\theta}=E_{z\sim p_{\theta}(z)}[f(z)] Lθ=Ezpθ(z)[f(z)]
此时z可能服从连续分布,也可能服从离散分布,上式的期望求解可以分为如下两种:
连 续 情 况 : L θ = ∫ p θ ( z ) f ( z ) d z 连续情况:L_{\theta}=\int p_{\theta}(z)f(z)dz Lθ=pθ(z)f(z)dz
离 散 情 况 : L θ = ∑ z p θ ( z ) f ( z ) 离散情况:L_{\theta}=\sum_z p_{\theta}(z)f(z) Lθ=zpθ(z)f(z)
连续情况: 为了最小化期望 L θ L_{\theta} Lθ,则需要求出其积分值,精确地计算出期望值是难以实现,则会使用采样的方式,在采样的过程中还需要保留 θ \theta θ的信息(即,梯度),直接的采样将会失去 θ \theta θ信息(例:如分布 p θ p_\theta pθ中直接采样得到5,此时是无法知道5与 θ \theta θ之间的关系,也就更无法计算出梯度值),此时就需要使用到reparameterization trick

具体步骤:

  • step1:从与 θ \theta θ参数无关的分布中直接采样,例:从分布 q ϵ ( x ) q_\epsilon(x) qϵ(x)中采样得到 x x x
  • step2:然后使用含 θ \theta θ参数的函数 g θ ( x ) g_\theta(x) gθ(x)将从 q ϵ ( x ) q_\epsilon(x) qϵ(x)中采样得到 x x x转化成 z z z
    L θ = E x ∼ q ϵ ( x ) [ f ( g θ ( x ) ) ] L_{\theta}=E_{x\sim q_{\epsilon}(x)}[f(g_\theta(x))] Lθ=Exqϵ(x)[f(gθ(x))]
    通过重参数转化后,就可以直接在 q ϵ ( x ) q_{\epsilon}(x) qϵ(x)上进行采样(例:加入从 q ϵ ( x ) q_{\epsilon}(x) qϵ(x)中直接采样得到了0.2,然后带入 g θ ( x ) g_{\theta}(x) gθ(x)中得到5,这样就知道5与参数 θ \theta θ的关系,就可以正常地求出梯度)

离散情况 z z z服从离散分布,其值是有限的,此时 p θ ( z ) p_\theta(z) pθ(z)就相当于一个 k k k分类
p θ ( z ) = s o f t m a x ( o 1 , o 2 , . . . , o k ) p_\theta(z)=softmax(o_1,o_2,...,o_k) pθ(z)=softmax(o1,o2,...,ok)
对于离散情况下,期望 L θ L_\theta Lθ的计算就是对有限项进行求和,在使用GAN生成文本任务中,词典大小为 ∣ V ∣ |V| V,句子的长度为 l l l,则所有句子的数量就有 ∣ V ∣ l |V|^l Vl个,这种情况下,进行求和操作是相当困难的,此时就需要使用采样来有效地估计出期望 L θ L_\theta Lθ
Gumbel Max:提供了从类别分布中进行采样
在这里插入图片描述
证明:Gumbel Max输出值为 i i i的概率是 p i p_i pi,可证输出1的概率是 p 1 p_1 p1
在这里插入图片描述
其中argmax是不可导的,则梯度信息会消失,于是就采用softmax来光滑近似argmax,也就是Gumbel softmax
在这里插入图片描述
τ > 0 \tau>0 τ>0则为退火参数,其值越小,输出的结果就越接近one-hot,此时梯度消失就越严重,Gumbel softmax比Gumbel max更加地光滑,原始的softmax退火后只能到达最大位置为1的one-hot向量,Gumbel softmax也有可能达到非最大位置的one-hot向量,相比于原始softmax,Gumber softmax更由随机性,采样后的数据有助于模型进行训练。

参考:

gumbel分布
重参数

  • 5
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
重新设计了新的标签页,其中包括书签、应用程序、最近访问过的、最近关闭的,以及在一个定制的布局中的天气。 功能:•简单,简洁的设计•高度可定制•快速加载和轻量级此扩展程序替换了默认的新标签页。拖放文件夹以创建新列或对其重新排序。字体,颜色,间距等可以从选项菜单中自定义。可在MIT许可证下获得源代码github.com/quodroc/HumbleNewTabPage Changelog:版本1.24-2019年2月10日•暂时禁用的天气功能•改进的键盘导航•固定的错误打开选项版本1.23-2018年12月2日•为以下内容添加了工具提示截断的文本•添加了用于记住打开的文件夹的选项版本1.21-2016年11月20日•添加了HiDPI图标•修复了导出设置不可选择的版本1.20-2016年6月1日•添加了导入/导出设置•修复了最近关闭的最大项目版本1.19-4月14日,2016•固定的天气不更新版本1.18-2016年4月3日•删除了地理位置•固定的天气错误版本1.17-2016年1月24日•固定的天气错误版本1.16-2014年8月29日•添加了其他设备文件夹•最近关闭的选项卡保留了历史记录•删除了后台进程•需要37版或更高版本的Chrome浏览器1.15版-2014年7月6日•修复了冻结问题1.14版-2014年5月11日•减少了内存使用量•添加了设置选项最近关闭的书签,最近访问的书签和访问最多的项目的数量•添加的背景图片大小选项•在文件夹上下文菜单版本1.12-2013年8月18日中添加了指向书签管理器的链接•通过版本1.11-8月3日的拖放对应用程序进行重新排序2013年•修复了启动打包的应用程序(Google Keep)•修复了启动文件:///和chrome:// URL•修复了Mobile Bookmarks文件夹不可移动的问题•如果拒绝地理位置,则禁用天气•默认布局更改为2列•从以下位置卸载应用程序上下文菜单•从1.9版的应用程序中隐藏Google电子钱包服务-2012年12月30日•默认情况下使用地理位置进行天气•拖放修复的错误•在1.8版的应用程序中添加了Chrome Web Store-2012年11月9日•重新设计了选项面板•添加了几个新设置•性能调整•根据MIT许可证1.7版发布的源代码-2012年9月8日•为高级用户添加了自定义CSS字段•添加了用于隐藏书签栏和其他书签版本1的选项 2012年6月6日至8月30日•添加选项以打开新选项卡中的链接•支持本地文件获取背景图像•修复了天气错误版本1.5-2012年8月29日•天气预报现在使用Yahoo•在支持的版本1.4上启用了系统字体列表- 2012年8月10日•添加了禁用天气和其他特殊文件夹的选项•修复了1.3版的小错误-2012年8月9日•修复了旧版Chrome版本1.2的错误-2012年8月8日•添加了应用程序,这些应用程序访问最多,最近关闭,和天气•布局灵活,列数不受限制•从上下文菜单中打开文件夹中的所有链接•颜色主题和新的默认样式•添加了平滑的动画并突出显示阴影•拖放以重新排序文件夹和列•背景图像支持•漏洞修复•新增功能名称(以前是“新标签页”和“书签树”)版本1.1-2011年7月20日•添加了选项菜单版本1.0-2011年7月17日•初始版本 支持语言:English

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

请多关赵

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值