【计算机视觉】ReLU函数在0处不可导，为什么还能用

最新推荐文章于 2024-07-01 19:47:40 发布

FL6123863129

最新推荐文章于 2024-07-01 19:47:40 发布

阅读量868

点赞数 1

分类专栏：计算机视觉深度学习文章标签：计算机视觉人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/liufang_imei/article/details/128650983

版权

深度学习同时被 2 个专栏收录

102 篇文章 17 订阅 ¥29.90 ¥99.00

订阅专栏

超级会员免费看

计算机视觉

67 篇文章 32 订阅 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

ReLU函数在0处不可导，但在深度学习中广泛使用。为解决不可导问题，可通过定义伪梯度（如在0处导数为0）或使用ln(1+ex)近似。ReLU的优势包括简洁的函数形式、解决梯度消失问题、提高运算速度及引入网络稀疏性。然而，ReLU可能导致神经元死亡，对此有Leaky ReLU等变种作为改进。

摘要由CSDN通过智能技术生成

问题

ReLU函数在0处不可导，为什么在深度学习网络中还这么常用?

问题背景

这是在阿里的机器学习岗一面的时候问的一个问题，最开始的问题是“为什么机器学习中解决回归问题的时候一般使用平方损失（即均方误差）？”。

当时我的回答是损失函数是是模型预测值与真实值之间的一种距离度量，我们可以计算出每个样本的预测值与真实值之间的距离，全部加起来就得到了所谓的损失函数。而距离的度量可以采用预测值与真实值之间差的绝对值，或者两者之差的平方，当然更高次的也行，只要你喜欢。正如问题所述，为什么我们一般使用的是两者之差的平方而不是两者只差的绝对值呢？其实这与模型的求解相关，举最简单的线性回归为例，如果采用的距离是两者之差的绝对值，那么求解的目标函数如下：

了解本专栏

超级会员免费看

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
【计算机视觉】ReLU函数在0处不可导，为什么还能用

另外还有一个方法是使用。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

FL6123863129 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。