- x > 0 x>0 x>0部分梯度恒为1,可以防止梯度消失
-
x
<
0
x<0
x<0部分激活值恒为0,给网络带来稀疏性和正则化效果。而稀疏表示相比于稠密表示,使用了更少的参数来得到一个更简单,更具解释性的模型。
稀疏表示(sparse representation),即用较少的基本信号的线性组合来表达大部分或者全部的原始信号。
Why ReLU
最新推荐文章于 2022-05-19 21:10:57 发布