Tensorflow05-激活函数、优化器、过拟合和Dropout

最新推荐文章于 2024-03-14 16:04:11 发布

yfraquelle

最新推荐文章于 2024-03-14 16:04:11 发布

阅读量1.9k

点赞数 1

分类专栏： Tensorflow MachineLearning

本文链接：https://blog.csdn.net/y_f_raquelle/article/details/77675992

版权

MachineLearning 同时被 2 个专栏收录

26 篇文章 0 订阅

订阅专栏

Tensorflow

15 篇文章 1 订阅

订阅专栏

1.激活函数

激活函数用于在线性组合之后添加非线性因素。在我看来，相当于扩大不同类数据之间的差距。称之为“激活”，就是让一类数据激活一个条件得到一个显著不同的输出。

激活函数把卷积后的结果压缩到某一个固定的范围，这样可以一直保持一层一层下去的数值范围是可控的。

常见的激活函数有如下：

tf.nn.relu(features, name=None)
tf.nn.relu6(features, name=None)
tf.nn.crelu(features, name=None)
tf.nn.elu(features, name=None)
tf.nn.softplus(features, name=None) 常用于分类
tf.nn.softsign(features, name=None) 常用于分类
tf.nn.dropout(x, keep_prob, noise_shape=None, seed=None, name=None) 常用于分类
tf.nn.bias_add(value, bias, data_format=None, name=None) 减少过拟合
tf.sigmoid(x, name=None) 常用于分类
tf.tanh(x, name=None)

他们的图像如下：

可以看出激活函数的特征：

非线性：当激活函数是线性的时候，一个两层的神经网络就可以逼近基本上所有的函数了。但是，如果激活函数是恒等激活函数的时候（即 f(x)=x ），就不满足这个性质了，而且如果MLP使用的是恒等激活函数，那么其实整个网络跟单层神经网络是等价的。
可微性：当优化方法是基于梯度的时候，这个性质是必须的。
单调性：当激活函数是单调的时候，单层网络能够保证是凸函数。
f(x)≈x ：当激活函数满足这个性质的时候，如果参数的初始化是random的很小的值，那么神经网络的训练将会很高效；如果不满足这个性质，那么就需要很用心的去设置初始值。
输出值的范围：当激活函数输出值是有限的时候，基于梯度的优化方法会更加稳定，因为特征的表示受有限权值的影响更显著；当激活函数的输出是无限的时候，模型的训练会更加高效，不过在这种情况小，一般需要更小的learning rate.

2.优化器

训练人工神经网络的问题本质上是一个最优化的问题，通俗来说就是“找最值”的问题。最常见的就是梯度下降法（GradientDescentOptimizer），即每次都向下降最快的方向减小，最终找到让差距（成本）达到最小值的那组参数。

常见的优化器：

tf.train.GradientDescentOptimizer 最基础的线性优化，如果传入的数据只是一部分，就变成了SGD，一部分一部分地学习，可以更快到达全局最小量
tf.train.AdadeltaOptimizer
tf.train.AdagradOptimizer
tf.train.MomentumOptimizer 常用，考虑了不仅本布的学习效率，还考虑了上一步的学习效率，可能一开始趋势错误，但能很快纠正，更快速到达全局最小量
tf.train.AdamOptimizer 常用
tf.train.FtrlOptimizer AlphaGO使用
tf.train.RMSPropOptimizer

它们的不同效果可以参见莫烦教学中的动画

3.过拟合

当训练数据量比较小时，可能会出现因为追求最小差值导致训练出来的模型极度符合训练集，但是缺乏普适性，不能表达训练数据之外的数据。

形象化来看就是：

本来有普适性的模型被训练成了具有训练集特殊性

以至于对于真实的数据产生了错误

应对过拟合的措施：

1-增加数据量

2-正规化y=Wx，W为各种参数，在W变化得太大时，将误差也变得更大，作为一种惩罚机制
L1正规化 cost=(Wx-real_y)^2+abs(W))
L2正规化 cost=(Wx-real_y)^2+W^2

3-Dropout正规化，每次训练后随机忽略一些神经元，使得神经网络不完整，这样得出的结果不会依赖于某一部分特定的神经元

4.Dropout

Tensorflow07中具体说明

参考链接：

https://www.tensorflow.org/versions/r0.12/api_docs/python/nn/activation_functions_

https://www.tensorflow.org/api_guides/python/train

https://www.youtube.com/watch?v=6gbGCxBGxZA&list=PLXO45tsB95cKI5AIlf5TxxFPzb-0zeVZ8&index=13

http://blog.csdn.net/cyh_24/article/details/50593400

yfraquelle

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
Tensorflow05-激活函数、优化器、过拟合和Dropout

1.激活函数激活函数用于在线性组合之后添加非线性因素。在我看来，相当于扩大不同类数据之间的差距。称之为“激活”，就是让一类数据激活一个条件得到一个显著不同的输出。常见的激活函数有如下：tf.nn.relu(features, name=None)tf.nn.relu6(features, name=None)tf.nn.crelu(features, name=
复制链接

扫一扫