机器学习（周志华）——第五章　神经网络

最新推荐文章于 2021-12-29 21:03:09 发布

vikiminimomo

最新推荐文章于 2021-12-29 21:03:09 发布

阅读量3.3k

点赞数 1

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/vikiminimomo/article/details/93379185

版权

本文深入探讨了神经网络中的激活函数，包括Sigmoid、tanh、ReLU和ELU，分析了它们的优缺点。同时，介绍了BP算法、RBF网络和RNN循环神经网络的基本概念及特点，以及如何缓解BP网络过拟合问题。此外，讨论了卷积神经网络的卷积、下采样过程，并提到了在Kaggle手写数字识别比赛中应用的CNN模型。

摘要由CSDN通过智能技术生成

神经网络

前提: 在机器学习中谈的神经网络是值的 “神经网络学习”，或者说，是机器学习与神经网络这两个学科领域的交叉部分.

神经元的职责: 接受来自于其他神经元传输过来的信号，将接收到的总输入值与该神经元的阈值进行对比，通过激活函数处理以产生神经元的输出. 示意图如下所示.
在这里插入图片描述

1. 常见的激活函数，将线性函数用作神经元激活函数的缺陷。

(1). 阶跃函数
阶跃函数是理想的激活函数，其将输入值映射为输出值 “0” 和 “1” ，显然 “1” 对应兴奋，而 “0” 对应抑制.

但是，阶跃函数不连续，不光滑，所以实际中常用 “ $S i g m o i d$ ” 函数作为激活函数.

(2). $S i g m o i d$ 函数
$S i g m o i d$ 函数把可能在较大范围内变化的输入值挤压到 (0, 1) 输出值范围内，且函数连续、光滑. 表达式如下:
$\sigma (x) = \frac {1}{1+e^{-x}}$

但是呢…

当输入稍微远离了坐标原点，函数的梯度就变得很小了，几乎为零。在神经网络反向传播的过程中，我们都是通过微分的链式法则来计算各个权重w的微分的。当反向传播经过了sigmod函数，这个链条上的微分就很小很小了，况且还可能经过很多个sigmod函数，最后会导致权重w对损失函数几乎没影响，这样不利于权重的优化，这个问题叫做梯度饱和，也可以叫梯度弥散。
函数输出不是以0为中心的，这样会使权重更新效率降低。
sigmod函数要进行指数运算，这个对于计算机来说是比较慢的。

在这里插入图片描述
(3). $t a h n$ 函数
tanh是双曲正切函数，tanh函数和sigmod函数的曲线是比较相近的. 表达式如下:
$\sigma (x) = \frac {e^{x}-e^{-x}}{e^{x}+e^{-x}}$

最低0.47元/天解锁文章

关注

1
点赞
踩
7

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。