Towards Binary-Valued Gates for Robust LSTM Training

Towards Binary-Valued Gates for Robust LSTM Training

一、首先给出LSTM公式

it=σ(Wxixt+Whiht1+bi) i t = σ ( W x i x t + W h i h t − 1 + b i )
ft=σ(Wxfxt+Whfht1+bf) f t = σ ( W x f x t + W h f h t − 1 + b f )
ot=σ(Wxoxt+Whoht1+bo) o t = σ ( W x o x t + W h o h t − 1 + b o )
zi=tanh(Wxzxt+Whzht1+bz)) z i = t a n h ( W x z x t + W h z h t − 1 + b z ) )
ct=ct1fi+ziit c t = c t − 1 ∗ f i + z i ∗ i t
ot=ottanh(ct) o t = o t ∗ t a n h ( c t )

在输入门,与遗忘门通常使用的是 σ σ 函数,公式是: σ(y)=eyiNj=1eyj σ ( y ) = e y i ∑ j = 1 N e y j 是一个0-1的值。我们选用该函数的目的就是为了用这些门来控制信息的流动。在此文中作者提出一种新的方法,即用 Gumbel 函数来更好的逼近0,和1从而使得更好的达到我们预期的目标。因为:此时函数大多时候处于0,和1附近,而不是出于0-1的某些中间值,使得结果解释性更好。

通过实验作者发现。
1、尽管看上去限制取值的柔度会影响模型效果,但实际情况并不是如此。
2、每一个门的输出对他们的输入不会特别敏感。

二、证明Gumbel的可用性

定义 σ(.) σ ( . ) 是是一个sigmoid()函数。给定 αR α ∈ R 并且 τ>0 τ > 0 .定义随机变量 DαB(σ(α)) D α ∼ B ( σ ( α ) ) 这里 B(σ(α)) B ( σ ( α ) ) 是伯努利分布,定义 G(α,τ)=σ(α+logUlog(1U)τ) G ( α , τ ) = σ ( α + l o g U − l o g ( 1 − U ) τ ) ,这里 UUniform(0,1) U ∼ U n i f o r m ( 0 , 1 ) 那门下面的不等式在当 ε(0,1/2) ε ∈ ( 0 , 1 / 2 ) 时,成立。
P(Dα=1)(τ/4)log(1/ε)P(G(α,τ)1ε)P(Dα=1) P ( D α = 1 ) − ( τ / 4 ) l o g ( 1 / ε ) ⩽ P ( G ( α , τ ) ⩾ 1 − ε ) ⩽ P ( D α = 1 ) (1)
P(Dα=0)(τ/4)log(1/ε)P(G(α,τ)1ε)P(Dα=0) P ( D α = 0 ) − ( τ / 4 ) l o g ( 1 / ε ) ⩽ P ( G ( α , τ ) ⩾ 1 − ε ) ⩽ P ( D α = 0 ) (2)

证明:

σ(x)=11+ex σ ( x ) = 1 1 + e − x
σ1(x)=logx1x σ − 1 ( x ) = l o g x 1 − x

P(G(α,τ)1ε) P ( G ( α , τ ) ⩾ 1 − ε )
=P(σ(α+logUlog(1U)τ)1ε) = P ( σ ( α + l o g U − l o g ( 1 − U ) τ ) ⩾ 1 − ε )

这里用的是逆哈函数,直接两边取逆函数,根据性质当原函数递增的时候,逆函数也递增。

=P(α+logUlog(1U)τlog(1ε1)) = P ( α + l o g U − l o g ( 1 − U ) τ ⩾ l o g ( 1 ε − 1 ) )
=P(eατlog(1ε1)(1U)U) = P ( e α − τ l o g ( 1 ε − 1 ) ⩾ ( 1 − U ) U )
=P(U11+eατlog(1ε1) = P ( U ⩾ 1 1 + e α − τ l o g ( 1 ε − 1 )
=σ(ατlog(1ε1)) = σ ( α − τ l o g ( 1 ε − 1 ) )

考虑到sigmoid function是四分之一的Lipschitz 连续并且单点递增,于是有
P(Dα=1)P(G(α,τ)1ε) P ( D α = 1 ) − P ( G ( α , τ ) ⩾ 1 − ε )
=σ(α)σ(ατlog(1ε1)) = σ ( α ) − σ ( α − τ l o g ( 1 ε − 1 ) )
(τ4)log(1ε1)(τ4)log(1ε) ⩾ ( τ 4 ) l o g ( 1 ε − 1 ) ⩾ ( τ 4 ) l o g ( 1 ε )

并且 P(Dα=1)P(G(α,τ)1ε)0 P ( D α = 1 ) − P ( G ( α , τ ) ⩾ 1 − ε ) ⩾ 0

τ τ 逼近0时候公式一,公式二再根据夹逼准则于,
P(limτ0+G(α,τ)=1)=P(Dα=1) P ( l i m τ − 0 + G ( α , τ ) = 1 ) = P ( D α = 1 )
P(limτ0+G(α,τ)=0)=P(Dα=0) P ( l i m τ − 0 + G ( α , τ ) = 0 ) = P ( D α = 0 )
于是Gumble函数近似二项分布

最终LSTM公式被修改成
it=G(Wxixt+Whiht1+bi,τ), i t = G ( W x i x t + W h i h t − 1 + b i , τ ) ,
ft=G(Wxfxt+Whfht1+bf,τ) f t = G ( W x f x t + W h f h t − 1 + b f , τ )
ot=σ(Wxoxt+Whoht1+bo) o t = σ ( W x o x t + W h o h t − 1 + b o )
zi=tanh(Wxzxt+Whzht1+bz)) z i = t a n h ( W x z x t + W h z h t − 1 + b z ) )
ct=ct1fi+ziit c t = c t − 1 ∗ f i + z i ∗ i t
ot=ottanh(ct) o t = o t ∗ t a n h ( c t )

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
系统根据B/S,即所谓的电脑浏览器/网络服务器方式,运用Java技术性,挑选MySQL作为后台系统。系统主要包含对客服聊天管理、字典表管理、公告信息管理、金融工具管理、金融工具收藏管理、金融工具银行卡管理、借款管理、理财产品管理、理财产品收藏管理、理财产品银行卡管理、理财银行卡信息管理、银行卡管理、存款管理、银行卡记录管理、取款管理、转账管理、用户管理、员工管理等功能模块。 文中重点介绍了银行管理的专业技术发展背景和发展状况,随后遵照软件传统式研发流程,最先挑选适用思维和语言软件开发平台,依据需求分析报告模块和设计数据库结构,再根据系统功能模块的设计制作系统功能模块图、流程表和E-R图。随后设计架构以及编写代码,并实现系统能模块。最终基本完成系统检测和功能测试。结果显示,该系统能够实现所需要的作用,工作状态没有明显缺陷。 系统登录功能是程序必不可少的功能,在登录页面必填的数据有两项,一项就是账号,另一项数据就是密码,当管理员正确填写并提交这二者数据之后,管理员就可以进入系统后台功能操作区。进入银行卡列表,管理员可以进行查看列表、模糊搜索以及相关维护等操作。用户进入系统可以查看公告和模糊搜索公告信息、也可以进行公告维护操作。理财产品管理页面,管理员可以进行查看列表、模糊搜索以及相关维护等操作。产品类型管理页面,此页面提供给管理员的功能有:新增产品类型,修改产品类型,删除产品类型。
强噪声的理想时频表示方法主要是为了在频域和时域上准确地表示出噪声信号。在处理强噪声信号时,我们希望减小噪声对信号的影响,从而更好地分析和提取信号的特征。 首先,为了处理强噪声信号,可以考虑使用适当的滤波方法。例如,我们可以使用带通滤波器来去除噪声信号中的不必要的低频和高频成分,从而保留信号的主要特征。此外,还可以采用自适应滤波器来根据噪声信号的特性自动调整滤波参数,以更好地去除噪声。 其次,为了获得理想的时频表示,可以考虑使用一些先进的时频分析方法,如短时傅里叶变换(STFT)、连续小波变换(CWT)或多尺度分析方法(如小波包变换)。这些方法可以将信号在时域和频域上进行局部化处理,从而更好地反映信号的瞬时特性和频谱特性。 另外,为了进一步减小噪声对时频表示的影响,可以考虑使用一些去噪技术。例如,小波阈值去噪是一种常用的方法,它可以根据信号的小波系数大小来判断是否为噪声,从而去除噪声成分。此外,还可以使用基于机器学习的方法来训练和应用噪声模型,从而更准确地估计和去除噪声。 综上所述,针对强噪声的理想时频表示方法可以包括滤波、时频分析和去噪等步骤。通过有效地组合这些方法,我们可以更准确地分析和提取信号的特征,从而更好地理解和利用强噪声信号。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值