relu不可微为什么可用于深度学习

最新推荐文章于 2024-07-09 23:15:27 发布

Takoony

最新推荐文章于 2024-07-09 23:15:27 发布

阅读量7.2k

点赞数 7

分类专栏： ml

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ningyanggege/article/details/82493023

版权

ml 专栏收录该内容

188 篇文章 17 订阅

订阅专栏

首先确定relu数学上来讲不可微的，提供伪梯度使其可分，faux gradient是伪梯度，使得在0值不可分；

这里讲到了本质，反馈神经网络正常工作需要的条件就是每一个点提供一个方向，即导数；0值不可微，本质上来说是因为这个地方可画多条切线，但我们需要的只是一条；由于这出现的0值的概率极低，任意选择一个子梯度就OK了，在0处的次微分集合是【0，1】；即选择其中一个就OK了；一般默认是0；

关注

7
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

博客等级

码龄16年

780
原创

1700
点赞

4569
收藏

925
粉丝

关注

私信

热门文章

分类专栏

nlp 6篇
图计算 8篇
安全 16篇
其他 8篇
KG 39篇
大数据
acm算法 3篇
paper
meta_learning
deep learning 166篇
python 299篇
ml 188篇
linux 99篇
financial_ 4篇
kaggle 4篇
git 18篇
bigdata 34篇
vim 53篇
computer_tools 4篇
tensorflow 10篇

最新评论

transformer之KV Cache
慢慢走比较快k: 大佬你好，我是刚入门，可以说一下具体的文章吗，我也想学习一下kvcache到底优化到什么程度，多谢了
Python中的列表：当内置遇上类型提示
CSDN-Ada助手: Python入门技能树或许可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
svm硬间隔与软间隔
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)增加除了各种控件外，文章正文的字数；(2)提升标题与正文的相关性；(3)增加条理清晰的目录。
箱线图的理解
sdsswydyj: 离得那个越近，那个就占比越高，就要乘更大的数
凸凹函数看二阶导数
woai809wansui: 国内外关于凹凸性定义不一样的

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。