一、初始化器的概念及其用法
概念:
初始化定义了设置 Keras 各层权重随机初始值的方法。
用法:
用来将初始化器传入 Keras 层(包括不限于Dense层、Conv2D层、等等)的参数名取决于具体的层。通常关键字为 kernel_initializer 和 bias_initializer:
你可以给它们传递初始化器的名字字符串,例如:
model.add(Dense(64,
kernel_initializer='random_uniform',
bias_initializer='zeros'))
也可以给它们传递初始化器的实例,这种方式可以让你更改初始化器的参数,比较自由,例如:
model.add(Dense(64,
kernel_initializer=keras.initializers.Constant(value=3.0),
bias_initializer=keras.initializers.RandomNormal(mean=0.0, stddev=0.05, seed=None))
一般来说,kernel_initializer默认值为'glorot_uniform',对应的实例是keras.initializers.glorot_uniform(seed=None)
一般来说,bias_initializer默认值为'zeros',对应的实例是keras.initializers.Zeros()
可用的初始化汇总
import tensorflow.keras as keras
# ######################可用初始化器汇总########################
keras.initializers.Initializer() # 初始化器基类:所有初始化器继承这个类。
keras.initializers.Zeros() # 将张量初始值设为 0 的初始化器。
keras.initializers.Ones() # 将张量初始值设为 1 的初始化器。将张量初始值设为 1 的初始化器。将张量初始值设为 1 的初始化器。
keras.initializers.Constant(value=0) # 将张量初始值设为一个常数的初始化器。value: 浮点数,生成的张量的值。
keras.initializers.RandomNormal(mean=0.0, stddev=0.05, seed=None) # 按照正态分布生成随机张量的初始化器。
keras.initializers.RandomUniform(minval=-0.05, maxval=0.05, seed=None) # 按照均匀分布生成随机张量的初始化器。
keras.initializers.TruncatedNormal(mean=0.0, stddev=0.05, seed=None) # 按照截尾正态分布生成随机张量的初始化器。
keras.initializers.VarianceScaling(scale=1.0, mode='fan_in', distribution='normal', seed=None) # 初始化器能够根据权值的尺寸调整其规模。
keras.initializers.Orthogonal(gain=1.0, seed=None) # 生成一个随机正交矩阵的初始化器。
keras.initializers.Identity(gain=1.0) # 生成单位矩阵的初始化器。
keras.initializers.lecun_uniform(seed=None) # LeCun 均匀初始化器。
keras.initializers.glorot_normal(seed=None) # keras.initializers.glorot_normal(seed=None)
keras.initializers.glorot_uniform(seed=None) # Glorot 均匀分布初始化器,也称为 Xavier 均匀分布初始化器。
keras.initializers.he_normal(seed=None) # He 正态分布初始化器。
keras.initializers.lecun_normal(seed=None) # LeCun 正态分布初始化器。
keras.initializers.he_uniform(seed=None) # He 均匀方差缩放初始化器。
初始化器对应的名字字符串为类名的小写,例如初始化器keras.initializers.RandomNormal(mean=0.0, stddev=0.05, seed=None)
的名字字符串就是'randomnormal'
更改初始化例子
#更改一个Dense层初始化器为keras.initializers.Zeros(),也可以小写'zeros'
from tensorflow.keras.layers import Dense, Input, Conv2D, MaxPooling2D
from tensorflow.keras import Sequential
import tensorflow.keras as keras
import numpy as np
# #建立一个测试模型
model = Sequential([
Dense(4, input_shape=(5,), name='dense_xiaoming',
kernel_initializer=keras.initializers.Zeros(), # 全部初始化为0
bias_initializer=keras.initializers.Ones()), # 全部初始化为1
])
x = np.ones(shape=(8, 5)) # 创建测试数据
y = model(x)
layer = model.get_layer('dense_xiaoming') # 通过层的名字得到层
(k, b) = layer.get_weights() # 查看层的初始化权重值和偏置项
print(k)
print(b)