SineReLU激活函数

"SineReLU是一种为了解决ReLU激活函数负区神经元死亡问题而提出的可微分替代方案。它通过调整超参数$epsilon$控制负区曲线的幅度,使得负区的梯度不为零,避免了反向传播时的梯度消失。然而,这也会带来计算量增大和输出不稀疏的挑战。SineReLU的导数曲线确保了负区的连续变化,且$epsilon$的正负值影响了曲线极值的方向和大小。"
摘要由CSDN通过智能技术生成

SineReLU激活函数

文章链接:[SineReLU-An Alternative to the ReLU Activation Function ]
年份:2018

介绍

该函数仍然是为了解决ReLU的负区域神经元死亡的问题,ReLU是一个不可微的函数,由此提出了一个可微的激活函数,称为SineReLU激活函数,具体的公式为:
f ( x ) = { x , x > 0 , ϵ ( s i n ( x ) − c o s ( x ) ) , x ≤ 0 f(x) = \begin{cases} x, &x>0,\\ \epsilon(sin(x)-cos(x)), &x\le 0 \end{cases} f(x)={x,ϵ(sin(x)cos(x)),x>0,x0
该函数的导数为:
f ′ ( x ) = { x , x > 0 , ϵ ( c o s ( x ) + s i n ( x ) ) , x ≤ 0 f^\prime(x) = \begin{cases} x, &x>0,\\ \epsilon(cos(x)+sin(x)), &x\le 0 \end{cases} f(x)={x,ϵ(cos(x)+sin(x)),x>0,x0
ϵ \epsilon ϵ作为超参数,用于控制SineReLU负区域曲线的波幅, ϵ \epsilon ϵ的绝对值越大,负区域曲线的幅值越大,具体的函数曲线如下图所示:在这里插入图片描述
SineReLU的导数曲线如下:
在这里插入图片描述

分析

  • 从图中可以看出,当 ϵ \epsilon ϵ为正值时,负区域的曲线从右到左的输出,负值 → \to 正值 → \to 负值 → \to 正值 → ⋯ \to \cdots
  • 从图中可以看出,当 ϵ \epsilon ϵ为负值时,负区域的曲线从右到左的输出,正值 → \to 负值 → \to 正值 → \to 负值 → ⋯ \to \cdots
  • ϵ \epsilon ϵ的绝对值越大,负区域的最大值越大,最小值越小。
    • ϵ \epsilon ϵ为正值时,极大值为:在 − 3 π 4 − 2 π n \frac{-3 \pi}{4}-2\pi n 43π2πn处,取得 ϵ 2 \epsilon \sqrt{2} ϵ2 ,反之为极小值。
    • ϵ \epsilon ϵ为正值时,极小值为:在 − 7 π 4 − 2 π n \frac{-7 \pi}{4}-2\pi n 47π2πn处,取得 − ϵ 2 -\epsilon \sqrt{2} ϵ2 ,反之为极大值。
  • 从梯度的曲线可以看出,负区域的梯度不为0,不会出现反向传播时梯度不更新的问题。
  • 但同样会出现计算量大的问题,而且输出不稀疏等问题。
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值