笔记 - 神经网络：参数初始化方式

最新推荐文章于 2024-07-28 03:56:40 发布

chen_holy

最新推荐文章于 2024-07-28 03:56:40 发布

阅读量709

点赞数 1

分类专栏： AI 编程模型训练

本文链接：https://blog.csdn.net/chen_holy/article/details/91047174

版权

编程同时被 3 个专栏收录

73 篇文章 0 订阅

订阅专栏

57 篇文章 1 订阅

订阅专栏

模型训练

7 篇文章 0 订阅

订阅专栏

本文探讨了神经网络中参数初始化的各种方式，包括均匀分布和正态分布的初始化，如Xavier初始化，以及它们对训练结果的影响。文章指出在特定场景下，如分类样本量大时，均匀分布更优，以避免样本不平衡。同时，讨论了权重和偏置的初始化策略，并强调初始化的重要性。

摘要由CSDN通过智能技术生成

服从均匀分布的初始化

random_uniform
- 自定义区间的均匀分布

tf.random_uniform(shape = (n_input, n_output), 
					minval=start, maxval=end, dtype=tf.float32)

rand
- [0,1)区间的均匀分布

# 10行一列
X = np.random.rand(10,1)
"""
 Create an array of the given shape and populate it with
 random samples from a uniform distribution
 over ``[0, 1)``.
"""

服从正态分布的初始化

random_normal
- 生成正态分布随机数
- 定义均值与方差，shape可以用 () 表示，也可以用 [] 表示

def random_normal(shape,
                  mean=0.0,
                  stddev=1.0,
                  dtype=dtypes.float32,
                  seed=None,
                  name=None):
------------------------------------------------------------------------
initial = tf.random_normal(shape=shape, stddev=stddev, dtype=tf.float32)


tf.Variable(initial, dtype=tf.float32, name=name_str)

truncated_normal
- 产生截断正态分布随机数
- 取值范围为 [ mean - 2 * stddev, mean + 2 * stddev ]

def truncated_normal(
    shape,
    mean=0.0,
    stddev=1.0,
    dtype=tf.float32,
    seed=None,
    name=None
)
--------------------------------------------------------------------------
initial = tf.truncated_normal(shape=shape, stddev=stddev, dtype=tf.float32)

randn
- 均值为0方差为1的正态分布

# 10行一列
Y = np.random.randn(10,1)

Xavier均匀初始化

def xavier_init(n_input, n_output, constant=1):
    start = -constant * np.sqrt(6.0/(n_input + n_output))
    end = constant * np.sqrt(6.0/(n_input + n_output))
    return tf.random_uniform((n_input, n_output), minval=start, maxval=end, dtype=tf.float32)