TanhExp激活函数

皮鼓坐凳子

于 2022-07-13 10:55:21 发布

阅读量309

点赞数

分类专栏：激活函数大全文章标签：深度学习人工智能机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_38190702/article/details/125759405

版权

激活函数大全专栏收录该内容

32 篇文章 0 订阅

订阅专栏

TanhExp

论文：TanhExp: A Smooth Activation Function with High Convergence Speed for Lightweight Neural Networks

年份：2020

一种用于轻量级神经网络的具有高收敛速度的平滑激活函数，在不增加网络规模的情况下，只需要少量的训练周期和不增加额外参数，TanhExp就可以提高轻量级神经网络的容量。TanhExp被定义为：
$f(x) = xtanh(e^x)$

其中tanh为：
$\frac{e^x - e^{-x}}{e^x + e^{-x}}$

TanhExp对x的一阶导数为：
$f^\prime(x) = tanh(e^x) - xe^x(tanh^2(e^x)-1)$

TanhExp的曲线和导数曲线如下图所示。
在这里插入图片描述
TanhExp在 $x = - 1.1$ 时，获得最小值，最小值 $\approx -0.3532$ ，TanhExp满足门控制机制，它是以输入为参数的函数，所以网络不会改变输入在正部分的初始分布，同时在接近零的负部分产生一个缓冲性，而且TanhExp还确保其输出的稀疏性，不是所有的输入都被激活。因此，当输入 $x$ 的负值较大，满足稀疏性的定义时，神经元可以近似视为未激活。这种稀疏特性允许模型控制输入表示的有效维数，同时更可能是线性可分的。与ReLU相比，TanhExp使这些神经元失活的概率更小。

当输入 $x > 1$ 时，TanhExp几乎等于一个线性变换，输出值和输入值的变化不超过0.01
TanhExp在接近零的地方呈现出更陡的梯度，可以加速网络中参数的更新。

皮鼓坐凳子

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
TanhExp激活函数

TanhExp
复制链接

扫一扫

专栏目录

皮鼓坐凳子 CSDN认证博客专家 CSDN认证企业博客

码龄7年

34: 原创

87万+: 周排名

150万+: 总排名

2万+: 访问

: 等级

382: 积分

1: 粉丝

29: 获赞

6: 评论

66: 收藏

私信

关注

热门文章

分类专栏

激活函数大全 32篇

最新评论

Mish、β-Mish激活函数
m0_72101111: 您好，β-mish则么实现呢？
m-arcsinh激活函数
qq_41283785: 求大佬指教，这个核函数是否满足mercer定理，怎么证明，唉
Hard Swish激活函数
皮鼓坐凳子: 收到
Hard Swish激活函数
qq_45814884: 第二个分段函数有错误，-3到0部分
跨系统的Synergy鼠标键盘共享
CSDN-Ada助手: CS入门技能树或许可以帮到你：https://edu.csdn.net/skill/gml?utm_source=AI_act_gml

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。