机器学习面试题（1）在深层网络中relu为什么比tanh和sigmoid效果好？

最新推荐文章于 2024-04-10 21:07:08 发布

磨牙的小朋友

最新推荐文章于 2024-04-10 21:07:08 发布

阅读量502

点赞数

文章标签：神经网络机器学习

本文链接：https://blog.csdn.net/my0npencv13poor/article/details/104510447

版权

（1）防止过拟合。Relu会使一部分神经元的输出为0，这样就造成了网络的稀疏性，并且减少了参数的相互依存关系，缓解了过拟合问题的发生。

（2）可以实现深层网络的训练。对于深层网络，sigmoid函数反向传播时，很容易就会出现梯度消失的情况，在sigmoid接近饱和区时，变换太缓慢，导数趋于0，这种情况会造成信息丢失，从而无法完成深层网络的训练。

（3）计算量小，加速网络的训练。采用tanh、sigmoid等函数，计算激活函数时，指数运算计算量大，反向传播求误差梯度时，求导涉及除法，计算量相对大，而采用Relu激活函数，整个过程的计算量节省很多。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

磨牙的小朋友

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

计算机视觉 | 面试题：05、常见的三种激活函数sigmoid、tanh和ReLU，以及它们各自的特点和用途。

Mrrunsen的博客

09-08

1988

问题在笔试问答题或面试中偶尔有涉及到激活函数的问题，这里简单总结一下深度学习中常见的三种激活函数sigmoid、tanh和ReLU，以及它们各自的特点和用途。 激活函数 激活函数的作用是什么？ 激活函数的主要作用是在神经网络中引入非线性因素。常见的三种激活函数 sigmoid tanh ReLU 公式 f(x)=11+e−xf(x)=\frac{1}{1+e^{-x}}f(x)=1+e−x1 f(x)=ex−e−xex+e−xf(x)=\frac{e^x-e^{-x}}{e^x+e^

总结了200道经典的机器学习面试题（附参考答案）

small-guo

07-01

7471

刷题，是面试前的必备环节。本文总结了往年BAT机器学习面试题，干货满满，值得收藏。想要入职大厂可谓是千军万马过独木桥。为了通过层层考验，刷题肯定是必不可少的。本文根据网络在线发布的BAT机器学习面试1000题系列，整理了一份面试刷题宝典。1.请简要介绍下SVM。SVM，全称是support vector machine，中文名叫支持向量机。SVM是一个面向数据的分类算法，它的目标是为确定一个分类超平面，从而将不同的数据分隔开。扩展：支持向量机学习方法包括构建由简至繁的模型：线性可分支持向量机、线性支持向量机

参与评论您还未登录，请先登录后发表或查看评论

防止过拟合

weixin_40852935的博客

04-12

409

非饱和激活函数ReLu为什么比饱和激活函数sigmoid、tanh好

qq_45583898的博客

07-02

2359

sigmoid和tanh是“饱和激活函数”，而ReLU及其变体则是“非饱和激活函数”。使用“非饱和激活函数”的优势在于两点：（1）“非饱和激活函数”能解决所谓的“梯度消失”问题。（2）能加快收敛速度。sigmoid将实值输出压缩在[0,1]范围内；tanh函数将实值输出压缩在[-1, 1]的范围。sigmoid函数在历史上曾非常常用，输出值范围为[0, 1]之间的实数。但是现在它已经不太受欢迎了，实际中很少使用。原因如下：（1）sigmoid函数饱和使梯度消失(sigmoidsaturate and kil

人工神经网络中为什么ReLU要好过于tanh和Sigmoid function

qq_40147888的博客

05-31

467

人工神经网络中为什么ReL要好过于tanh和Sigmoid function 采用SIgmoid等函数，算激活函数时（指数运算），计算量大，反向传播求误差梯度时，求导涉及求导和指数运算，计算量相对大，而采用ReLU激活函数时，整个过程的计算量节省很多。对于深层网络，sigmoid函数反向传播时，很容易出现梯度消失的情况（在Sogmoid接近饱和区时，变换太缓慢，导致趋于0，这种情况会造成信息丢失），这种现象称为饱和，从而无法完成深层网络的训练。而ReLU就不会有饱和倾向，不会有特别小的梯度出现。 Re

深度学习——人工神经网络中为什么ReLu要好过于tanh和sigmoid function？

qq_23418043的博客

09-22

1529

参考吴恩达的深度学习课程。先看看各个激活函数图：第一个问题：为什么引入非线性激励函数？如果不用激励函数（其实相当于激励函数是f(x) = x），在这种情况下你每一层输出都是上层输入的线性函数，很容易验证，无论你神经网络有多少层，输出都是输入的线性组合，与只有一个隐藏层效果相当，这种情况就是多层感知机（MLP）了。正因为上面的原因，我们决定引入非线性函数作为激励函数，这样深层神经网络...

人工神经网络中为什么ReLU好过tanh和sigmoid

Kester_的博客

08-22

502

人工神经网络中为什么ReLU好过tanh和sigmoid tanh和sigmoid是饱和激活函数，在x不断增大或减小后，y会越来越接近于一个固定值，像sigmoid就会接近0或1，这时梯度就会非常小，难以学习。而ReLu是非饱和激活函数，大于0的部分始终有不错的梯度，小于0的部分置0也增加了稀疏性，降低过拟合。 ...

机器学习面试题总结.pdf

04-09

机器学习作为数据密集型领域的核心技术，对于很多准备进入该行业的人来说，理解和掌握相关知识以及面试技巧至关重要。接下来，我将根据提供的文件内容，逐一详细解释相关知识点。 1. 神经网络降维方法：在神经网络...

深度学习面试题1.docx

最新发布

09-03

与传统机器学习不同，深度学习能够自动从数据中提取特征，而无需手动设计。它在处理大数据和高维数据（如图像和语音）方面表现优异。什么是神经网络？解释其基本组成部分。回答: 神经网络是一种模拟人脑神经元...

C++开发、机器学习、深度学习、推荐算法基础知识及面试题总结.zip

06-13

在IT行业中，C++开发、机器学习、深度学习和推荐算法是四个至关重要的领域，它们在构建高效软件、智能系统和个性化服务中扮演着核心角色。以下是对这些领域的详细阐述和相关知识点的总结：首先，C++是一种强大的、...

MNIST手写字识别+ReLU激活函数+规则化

03-18

MNIST手写字识别 ReLU激活函数规则化识别率最高可达到97.5

人工神经网络中为什么ReLu要好过于tanh和sigmoid function？

喜欢打酱油的老鸟

08-27

2544

先看sigmoid、tanh和RelU的函数图：第一，采用sigmoid等函数，算激活函数时（指数运算），计算量大，反向传播求误差梯度时，求导涉及除法和指数运算，计算量相对大，而采用Relu激活函数，整个过程的计算量节省很多。第二，对于深层网络，sigmoid函数反向传播时，很容易就会出现梯度消失的情况（在sigmoid接近饱和区时，变换太缓慢，导数趋于0，这种情况会造成信息丢...

为什么在CNNs中激活函数选用ReLU，而不用sigmoid或tanh函数？

benniaofei18的博客

04-09

7955

https://blog.csdn.net/shijing_0214/article/details/53143393第一个问题：为什么引入非线性激励函数？如果不用激励函数（其实相当于激励函数是f(x) = x），在这种情况下你每一层输出都是上层输入的线性函数，很容易验证，无论你神经网络有多少层，输出都是输入的线性组合，与没有隐藏层效果相当，这种情况就是最原始的感知机（Perceptron）了。...

【机器学习300问】66、ReLU激活函数相对于Sigmoid和Tanh激活函数的优点是什么？ReLU它有局限性吗？如何改进？

qq_39780701的博客

04-10

1637

ReLU激活函数相对于Sigmoid和Tanh激活函数的优点是什么？ReLU它有局限性吗？如何改进？

为啥ReLU比sigmoid或者tanh更好

zh515858237的专栏

06-21

631

为什么通常ReLU比Sigmoid效果好

m0_50833438的博客

09-20

1051

1、ReLU的计算速度比Sigmoid更快，因为ReLU只涉及简单的阈值比较和取最大值的操作。这在训练大型深度网络时可以节省大量的计算资源。2、Sigmoid函数的导数在接近其两个极端（0和1）时非常接近于0，这会导致反向传播中的梯度消失问题。这意味着在深层网络中，通过多个Sigmoid层传播梯度时，梯度会逐渐变得非常小，导致网络训练变得非常缓慢，甚至无法收敛。ReLU通过在正数部分保持导数为1，从而更好地解决了梯度消失问题。3、在ReLU中，负数部分被截断为0，所以在每个神经元上只有一部分激活。

激活函数、防止过拟合方法、加速训练方法、数据增强

qq_29462849的博客

05-10

9173

前言关于深度学习，看了许久，但是一直没有找个时间把相关知识点总结下来，今天特意督促自己写下所学内容，如有错误，还望指出。关于深度学习主要介绍以下几点：激活函数、防止过拟合方法、加速训练的方法 激活函数 深度学习中的激活函数主要有sigmoid、tanh、ReLu、Maxout函数等。 Sigmoid Tanh ReLu Maxout 防止过拟合防止过拟合方法主要有增加训...

深度学习第三讲之防止过拟合提高模型泛化能力