激活函数

kingsure001

于 2020-08-14 18:19:49 发布

阅读量269

点赞数

分类专栏：深度学习文章标签：神经网络深度学习 python 人工智能算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/kingsure001/article/details/107957680

版权

深度学习专栏收录该内容

15 篇文章 1 订阅

订阅专栏

激活函数

如果不用激活函数，每一层的输出都是上一层的线性组合，从而导致整个神经网络的输出为神经网络输入的线性组合，无法逼近任意函数。
在这里插入图片描述
1 sigmoid
数据压缩到[0,1]之间
promblems：
1 饱和的神经元导致梯度消失，输入非常大（10）或非常小（-10）时，其梯度接近于0
2 输出不是以0为均值
3 指数运算计算量大(问题不大)

2 tanh
数据压缩到[-1,1]之间
与Sigmoid相比，tanh是0均值的。
promblems：
与Sigmoid一样，饱和的神经元导致梯度消失

3 ReLU
1）优点：
相比于 sigmoid/tanh，有如下优点：

计算高效 ,没有饱和及梯度消失问题 ,缓解了过拟合问题的发生。
收敛速度比sigmoid/tanh快6倍

2）缺点：

训练的时候很”脆弱”，很容易就”die”了，小于0就会dead, 实际操作中，如果你的Learning Rate 很大，那么很有可能你网络中的40%的神经元都”dead”了。
如果你设置了一个合适的较小的Learning Rate，这个问题发生的情况其实也不会太频繁。
实际情况下，将偏置项置为0

当z<0时，梯度也消失了

4 Leaky-ReLU、P-ReLU

会解决ReLU挂掉的问题
在这里插入图片描述
5 ELU
优点：所有ReLU的优点，不会死，输出接近0均值
缺点：计算量大,需要指数运算

6 Maxout
maxout拥有ReLu的所有优点同时避免了神经元“死亡”的现象；但是，由于需要多训练了几组参数，网络的效率也大大降低了。

实际选择：

在这里插入图片描述

数据预处理

减去均值，除std 标准差
在这里插入图片描述

设置权重

tanh:
在这里插入图片描述
relu:

批量归一化

每一个输入都这小批量都做这样的操作,后计算方差,通过均值和方差进行归一化，后还有额外的缩放因子和平移因子（使用常量gamma进行缩放，因子beta进行平移，你在做的是允许你恢复恒等函数），而改进了整个网络的梯度流
在这里插入图片描述
BN的本质原理：在网络的每一层输入的时候，又插入了一个归一化层，也就是先做一个归一化处理（归一化至：均值0、方差为1），然后再进入网络的下一层。不过文献归一化层，可不像我们想象的那么简单，它是一个可学习、有参数（γ、β）的网络层。
在这里插入图片描述

跟踪训练过程

Learning Rate

Learning Rate太小(如1e-6)，cost下降很慢
Learning Rate太大(如1e-6)，cost增长爆炸 (cur cost > 3* originalcost)
在[1e-3,1e-5]范围内比较合适

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

kingsure001 CSDN认证博客专家 CSDN认证企业博客

码龄5年

85: 原创

30万+: 周排名

125万+: 总排名

13万+: 访问

: 等级

1565: 积分

74: 粉丝

146: 获赞

32: 评论

867: 收藏

私信

关注

热门文章

分类专栏

算法 4篇
Java 2篇
数学建模 22篇
sklearn 10篇
机器学习 22篇
深度学习 15篇
keras,tensorflow,pytorch 2篇
配置 4篇
遥感 2篇
python 6篇

最新评论

sklearn-决策树-红酒数据
晓阳凤年: ```python import numpy as np from sklearn.datasets import load_wine from sklearn.preprocessing import StandardScaler from sklearn.cluster import KMeans from sklearn.metrics import homogeneity_score, completeness_score, silhouette_score import matplotlib.pyplot as plt # 加载红酒数据 wine = load_wine() data = wine.data # Z-Score归一化预处理 scaler = StandardScaler() data_scaled = scaler.fit_transform(data) # K-means聚类 kmeans = KMeans(n_clusters=3) kmeans.fit(data_scaled) # 获取聚类结果标签 labels = kmeans.labels_ # 同质性 homogeneity = homogeneity_score(wine.target, labels) print("Homogeneity:", homogeneity) # 完全性 completeness = completeness_score(wine.target, labels) print("Completeness:", completeness) # 轮廓系数 silhouette = silhouette_score(data_scaled, labels) print("Silhouette Coefficient:", silhouette) # 绘制散点图 plt.scatter(data[:, 0], data[:, 1], c=labels) plt.xlabel("Feature 1") plt.ylabel("Feature 2") plt.show() ``` 运行以上代码可以完成红酒数据的K-means聚类，并输出同质性、完全性和轮廓系数分数。最后，根据聚类结果绘制了散点图，不同簇的数据点用不同颜色标记。
Anaconda环境下安装opencv（快速方法）
勇敢牛牛，不怕困难801: 啊啊啊啊，气死了，还是不行，一堆报错文件
美赛写作
INSIST.166: 在哪儿看视频呀
在anaconda中安装tensorflow和keras
qq_34706232: 这应该是anaconda非常重要的作用
Anaconda环境下安装opencv（快速方法）
理永: 这个成了

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。