TensorFlow_1参数初始化方法

最新推荐文章于 2023-07-11 20:52:17 发布

业余狙击手19

最新推荐文章于 2023-07-11 20:52:17 发布

阅读量2.8k

点赞数

分类专栏： # TensorFlow系列笔记

本文链接：https://blog.csdn.net/sxlsxl119/article/details/84999869

版权

TensorFlow系列笔记专栏收录该内容

19 篇文章 0 订阅

订阅专栏

TensorFlow学习系列：

TensorFlow_1参数初始化方法

TensorFlow_2学习率

TensorFlow_3激活函数

TensorFlow_4正则化

TensorFlow_5dropout

TensorFlow_6断点续训与Tensorboard可视化

TensorFlow_7优化器

TensorFlow_8损失函数

1，初始化为常量

1.1 constant_initializer()

tf中使用tf.constant_initializer(value)类生成一个初始值为常量value的tensor对象。constant_initializer类的构造函数定义：

def __init__(self, value=0, dtype=dtypes.float32, verify_shape=False):
    self.value = value
    self.dtype = dtypes.as_dtype(dtype)
    self._verify_shape = verify_shape

value：指定的常量
dtype： 数据类型
verify_shape： 是否可以调整tensor的形状，默认可以调整

1.2 实例代码：

import tensorflow as tf

value = [0, 1, 2, 3, 4, 5, 6, 7]
init = tf.constant_initializer(value)

with tf.Session() as sess:
    x = tf.get_variable('x', shape=[8], initializer=init)
    x.initializer.run()
    print(x.eval())

结果：

神经网络中经常使用常量初始化方法来初始化偏置项。当初始化一个维数很多的常量时，一个一个指定每个维数上的值很不方便，tf提供了 tf.zeros_initializer() 和 tf.ones_initializer() 类，分别用来初始化全0和全1的tensor对象。

import tensorflow as tf
 
init_zeros=tf.zeros_initializer()
init_ones = tf.ones_initializer()
 
with tf.Session() as sess:
    x= tf.get_variable('x', shape=[8], initializer=init_zeros)
    y = tf.get_variable('y', shape=[8], initializer=init_ones)
    x.initializer.run()
    y.initializer.run()
    print(x.eval())
    print(y.eval())

结果：

2，初始化为正太分布

2.1 tf.random_normal_initializer() 和 tf.truncated_normal_initializer()

初始化参数为正太分布在神经网络中应用的最多，可以初始化为标准正太分布和截断正太分布。

tf中使用 tf.random_normal_initializer() 类来生成一组符合标准正太分布的tensor。

tf中使用 tf.truncated_normal_initializer() 类来生成一组符合截断正太分布的tensor。

tf.random_normal_initializer 和 tf.truncated_normal_initializer 的构造函数定义：

def __init__(self, mean=0.0, stddev=1.0, seed=None, dtype=dtypes.float32):
    self.mean = mean
    self.stddev = stddev
    self.seed = seed
    self.dtype = _assert_float_dtype(dtypes.as_dtype(dtype))

mean： 正太分布的均值，默认值0
stddev： 正太分布的标准差，默认值1
seed： 随机数种子，指定seed的值可以每次都生成同样的数据
dtype： 数据类型

2.2 实例代码

import tensorflow as tf
 
init_random = tf.random_normal_initializer(mean=0.0, stddev=1.0, seed=None, dtype=tf.float32)
init_truncated = tf.truncated_normal_initializer(mean=0.0, stddev=1.0, seed=None, dtype=tf.float32)
  
with tf.Session() as sess:
    x = tf.get_variable('x', shape=[10], initializer=init_random)
    y = tf.get_variable('y', shape=[10], initializer=init_truncated)
    x.initializer.run()
    y.initializer.run()

    print(x.eval())
    print(y.eval())

结果：

3，初始化为均匀分布

3.1 tf.random_uniform_initializer()

tf中使用 tf.random_uniform_initializer 类来生成一组符合均匀分布的tensor。tf.random_uniform_initializer类构造函数定义：

def __init__(self, minval=0, maxval=None, seed=None, dtype=dtypes.float32):
    self.minval = minval
    self.maxval = maxval
    self.seed = seed
    self.dtype = dtypes.as_dtype(dtype)

minval: 最小值
maxval： 最大值
seed：随机数种子
dtype： 数据类型

实例代码

import tensorflow as tf
 
init_uniform = tf.random_uniform_initializer(minval=0, maxval=10, seed=None, dtype=tf.float32)
 
with tf.Session() as sess:
 
    x = tf.get_variable('x', shape=[10], initializer=init_uniform)
    x.initializer.run()
    print(x.eval())

结果：

从输出可以看到，均匀分布生成的随机数并不是从小到大或者从大到小均匀分布的，这里均匀分布的意义是每次从一组服从均匀分布的数里边随机抽取一个数。

3.2 tf.uniform_unit_scaling_initializer()

tf中另一个生成均匀分布的类是 tf.uniform_unit_scaling_initializer()，同样都是生成均匀分布，tf.uniform_unit_scaling_initializer 跟 tf.random_uniform_initializer 不同的地方是前者不需要指定最大最小值，是通过公式计算出来的（input_size是生成数据的维度，factor是系数）：

max_val = math.sqrt(3 / input_size) * factor
min_val = -max_val

构造函数是：

def __init__(self, factor=1.0, seed=None, dtype=dtypes.float32):
    self.factor = factor
    self.seed = seed
    self.dtype = _assert_float_dtype(dtypes.as_dtype(dtype))

实例代码：

import tensorflow as tf
 
init_uniform_unit = tf.uniform_unit_scaling_initializer(factor=1.0, seed=None, dtype=tf.float32)
  
with tf.Session() as sess:
    x = tf.get_variable('x', shape=[10], initializer=init_uniform_unit)
    x.initializer.run()
    print(x.eval())

结果：

4，初始化为变尺度正太、均匀分布

4.1 tf.variance_scaling_initializer()

tf中tf.variance_scaling_initializer()类可以生成截断正太分布和均匀分布的tensor，增加了更多的控制参数。构造函数：

def __init__(self, scale=1.0,
               mode="fan_in",
               distribution="normal",
               seed=None,
               dtype=dtypes.float32):
    if scale <= 0.:
      raise ValueError("`scale` must be positive float.")
    if mode not in {"fan_in", "fan_out", "fan_avg"}:
      raise ValueError("Invalid `mode` argument:", mode)
    distribution = distribution.lower()
    if distribution not in {"normal", "uniform"}:
      raise ValueError("Invalid `distribution` argument:", distribution)
    self.scale = scale
    self.mode = mode
    self.distribution = distribution
    self.seed = seed
    self.dtype = _assert_float_dtype(dtypes.as_dtype(dtype))

scale: 缩放尺度
mode： 有3个值可选，分别是 “fan_in”, “fan_out” 和 “fan_avg”，用于控制计算标准差 stddev的值
distribution： 2个值可选，”normal”或“uniform”，定义生成的tensor的分布是截断正太分布还是均匀分布

distribution选‘normal’的时候，生成的是截断正太分布，标准差 stddev = sqrt(scale / n), n的取值根据mode的不同设置而不同：

mode = "fan_in"， n为输入单元的结点数；         
mode = "fan_out"，n为输出单元的结点数；
mode = "fan_avg",n为输入和输出单元结点数的平均值;

distribution选 ‘uniform’，生成均匀分布的随机数tensor，最大值 max_value和最小值 min_value 的计算公式：

max_value = sqrt(3 * scale / n)
min_value = -max_value

4.2 实例代码：

import tensorflow as tf
 
init_variance_scaling_normal = tf.variance_scaling_initializer(scale=1.0,mode="fan_in",
                                                        distribution="normal",seed=None,dtype=tf.float32)
init_variance_scaling_uniform = tf.variance_scaling_initializer(scale=1.0,mode="fan_in",
                                                        distribution="uniform",seed=None,dtype=tf.float32)

with tf.Session() as sess:
 
    x = tf.get_variable('x', shape=[10], initializer=init_variance_scaling_normal)
    y = tf.get_variable('y', shape=[10], initializer=init_variance_scaling_uniform)
    x.initializer.run()
    y.initializer.run()

    print(x.eval())
    print(y.eval())

结果：

5，其他初始化方式

5.1 其他类

tf.orthogonal_initializer() 初始化为正交矩阵的随机数，形状最少需要是二维的
tf.glorot_uniform_initializer() 初始化为与输入输出节点数相关的均匀分布随机数
tf.glorot_normal_initializer() 初始化为与输入输出节点数相关的截断正太分布随机数

5.2实例代码：

import tensorflow as tf
 
init_orthogonal = tf.orthogonal_initializer(gain=1.0, seed=None, dtype=tf.float32)
init_glorot_uniform = tf.glorot_uniform_initializer()
init_glorot_normal = tf.glorot_normal_initializer()
 
with tf.Session() as sess:
    x = tf.get_variable('x', shape=[4,4], initializer=init_orthogonal)
    y = tf.get_variable('y', shape=[10], initializer=init_glorot_uniform)
    z = tf.get_variable('z', shape=[10], initializer=init_glorot_normal)

    x.initializer.run()
    y.initializer.run()
    z.initializer.run()

    print(x.eval())
    print(y.eval())
    print(z.eval())

结果：

欢迎扫码关注我的微信公众号

业余狙击手19

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
TensorFlow_1参数初始化方法

TensorFlow学习系列：TensorFlow_1参数初始化方法TensorFlow_2学习率TensorFlow_3激活函数TensorFlow_4正则化TensorFlow_5dropoutTensorFlow_6断点续训与Tensorboard可视化TensorFlow_7优化器TensorFlow_8损失函数 1，初始化为常量1.1 cons...
复制链接

扫一扫

专栏目录