机器学习随记（2）

最新推荐文章于 2024-03-20 20:26:21 发布

Young_IT

最新推荐文章于 2024-03-20 20:26:21 发布

阅读量592

点赞数

分类专栏：人工智能机器学习深度学习文章标签：机器学习 tensorflow 深度学习

本文链接：https://blog.csdn.net/Young_IT/article/details/130527682

版权

机器学习同时被 3 个专栏收录

11 篇文章 2 订阅

订阅专栏

人工智能

9 篇文章 0 订阅

订阅专栏

深度学习

7 篇文章 0 订阅

订阅专栏

`tf.keras.layers.Normalization` 是 TensorFlow 中的标准化层，它可以将输入数据标准化为均值为 0，方差为 1 的数据。具体来说，`tf.keras.layers.Normalization` 实现了以下操作：

1. 对输入数据进行逐个特征的标准化，即对每个特征计算其均值和标准差，然后对该特征进行标准化。

2. 可以指定标准化的轴（axis），默认为最后一个轴（即特征轴）。

`tf.keras.layers.Normalization` 的参数包括：

- `axis`：标准化的轴，默认为 -1，即最后一个轴（即特征轴）。

- `mean`、`variance`、`beta`、`gamma`：可以手动指定均值、方差、偏移量和缩放因子，如果不指定，则从输入数据中计算。

下面是一个使用 `tf.keras.layers.Normalization` 的示例：

import tensorflow as tf

# 创建一个标准化层
norm_layer = tf.keras.layers.Normalization(axis=-1)

# 输入数据
x = tf.constant([[1.0, 2.0, 3.0], [4.0, 5.0, 6.0], [7.0, 8.0, 9.0]])

# 计算均值和方差
mean = tf.reduce_mean(x, axis=-1, keepdims=True)
var = tf.reduce_mean(tf.square(x - mean), axis=-1, keepdims=True)

# 设置均值和方差
norm_layer.set_weights([mean, var])

# 标准化输入数据
y = norm_layer(x)

print(y)

在上面的示例中，首先创建了一个标准化层 `norm_layer`，然后计算输入数据 `x` 的均值和方差，并将其设置为标准化层的权重。最后，使用 `norm_layer` 对输入数据进行标准化，并输出标准化后的结果。

`np.tile(Xn,(1000,1))` 是 NumPy 库的函数，用于将数组 `Xn` 沿着指定的方向复制多次，生成一个新的数组。具体来说，`np.tile(Xn,(1000,1))` 将数组 `Xn` 沿着第一个轴（即行轴）复制 1000 次，沿着第二个轴（即列轴）复制 1 次，生成一个形状为 `(1000, n_features)` 的新数组。

例如，如果 `Xn` 是一个形状为 `(1, 4)` 的数组，其中包含了一个样本和四个特征，那么 `np.tile(Xn,(1000,1))` 将会生成一个形状为 `(1000, 4)` 的新数组，其中包含了 1000 个相同的样本。

下面是一个使用 `np.tile` 的示例：

import numpy as np

# 创建一个形状为 (1, 4) 的数组
Xn = np.array([[1, 2, 3, 4]])

# 将 Xn 沿着第一个轴复制 1000 次，沿着第二个轴复制 1 次
Xt = np.tile(Xn, (1000, 1))

print(Xt.shape)  # 输出 (1000, 4)

在上面的示例中，首先创建了一个形状为 `(1, 4)` 的数组 `Xn`，然后使用 `np.tile(Xn, (1000, 1))` 将其沿着第一个轴复制 1000 次，沿着第二个轴复制 1 次，生成一个形状为 `(1000, 4)` 的新数组 `Xt`。

`tf.random.set_seed(1234)` 是 TensorFlow 中设置随机种子的方法，它可以用于设置全局随机种子，以确保在每次运行代码时生成的随机数序列是相同的。具体来说，`tf.random.set_seed(1234)` 将全局随机种子设置为 1234，这意味着在每次使用随机数生成器时，都会使用相同的种子，从而生成相同的随机数序列。

在深度学习中，随机种子的设置非常重要，因为模型的训练过程通常涉及到随机初始化、随机采样等随机操作，如果随机数序列不同，会导致训练结果的不稳定性，使得模型的性能难以重现。

下面是一个使用 `tf.random.set_seed` 的示例：

import tensorflow as tf

# 设置全局随机种子
tf.random.set_seed(1234)

# 使用 TensorFlow 的随机数生成器生成一组随机数
a = tf.random.normal([3, 3])
b = tf.random.uniform([3, 3])

# 再次使用 TensorFlow 的随机数生成器生成一组随机数
c = tf.random.normal([3, 3])
d = tf.random.uniform([3, 3])

# 输出随机数
print(a)
print(b)
print(c)
print(d)

在上面的示例中，首先使用 `tf.random.set_seed(1234)` 设置全局随机种子为 1234，然后使用 TensorFlow 的随机数生成器生成一组随机数 `a` 和 `b`，再次使用随机数生成器生成一组随机数 `c` 和 `d`。由于设置了全局随机种子，因此每次运行代码时生成的随机数序列都是相同的，从而保证了生成的随机数是可重复的。

`tf.keras.Input` 是 TensorFlow 中的输入层，用于定义模型的输入格式。`Input` 层接受一个 `shape` 参数，用于指定输入数据的形状。例如，`tf.keras.Input(shape=(2,))` 表示输入数据是一个形状为 `(None, 2)` 的数组，其中 `None` 表示可以接受任意数量的样本。

`Input` 层通常用于将输入数据传递到神经网络中，可以作为模型的第一层或其他层的输入。在使用 `Input` 层时，需要注意以下几点：

- `Input` 层不进行任何计算，只是用于定义输入格式，因此不需要设置激活函数等参数。

- `shape` 参数需要指定输入数据的形状，其中 `None` 表示可以接受任意数量的样本。

- `Input` 层的输出可以作为其他层的输入，使用函数式 API 可以灵活地定义各种层级组合。

下面是一个使用 `Input` 层的示例：

import tensorflow as tf

# 定义输入层，输入数据是一个形状为 (None, 2) 的数组
input_layer = tf.keras.Input(shape=(2,))

# 定义一个全连接层，输出数据是一个形状为 (None, 1) 的数组
dense_layer = tf.keras.layers.Dense(units=1)(input_layer)

# 创建一个模型，输入是 input_layer，输出是 dense_layer
model = tf.keras.Model(inputs=input_layer, outputs=dense_layer)

# 输出模型的结构
model.summary()

在上面的示例中，首先使用 `tf.keras.Input(shape=(2,))` 定义一个输入层 `input_layer`，其中 `shape=(2,)` 表示输入数据是一个形状为 `(None, 2)` 的数组。然后使用 `tf.keras.layers.Dense(units=1)` 定义一个全连接层 `dense_layer`，输出数据是一个形状为 `(None, 1)` 的数组。最后，使用 `tf.keras.Model(inputs=input_layer, outputs=dense_layer)` 创建一个模型，指定输入层为 `input_layer`，输出层为 `dense_layer`，并输出模型的结构。

`model.compile` 是 TensorFlow 中用于编译模型的方法，它可以指定模型的损失函数、优化器、评估指标等参数。具体来说，`model.compile` 接受以下参数：

- `loss`：损失函数，用于评估模型在训练过程中的性能表现。

- `optimizer`：优化器，用于更新模型的参数以最小化损失函数。

- `metrics`：评估指标，用于评估模型在训练过程中的性能表现。

下面是一个使用 `model.compile` 的示例：

import tensorflow as tf

# 创建一个模型
model = tf.keras.Sequential([
    tf.keras.layers.Dense(64, activation='relu', input_shape=(784,)),
    tf.keras.layers.Dense(10, activation='softmax')
])

# 编译模型
model.compile(
    loss = tf.keras.losses.BinaryCrossentropy(),
    optimizer = tf.keras.optimizers.Adam(learning_rate=0.01),
    metrics = ['accuracy']
)

在上面的示例中，首先使用 `tf.keras.Sequential` 创建一个模型，包含两个全连接层。然后使用 `model.compile` 编译模型，指定损失函数为二分类交叉熵损失函数 `tf.keras.losses.BinaryCrossentropy()`，优化器为 Adam 优化器 `tf.keras.optimizers.Adam(learning_rate=0.01)`，评估指标为准确率。注意，这里的损失函数和优化器都是 TensorFlow 中的对象，需要先实例化后再传入 `model.compile` 中。

在编译模型后，可以使用 `model.fit` 方法训练模型，训练过程中会根据指定的损失函数和优化器更新模型的参数，并根据指定的评估指标评估模型的性能表现。

`model.fit` 是 TensorFlow 中用于训练模型的方法，它可以使用给定的训练数据对模型进行训练，并返回训练过程中的损失和指标。具体来说，`model.fit` 接受以下参数：

- `x`：训练数据，通常是一个形状为 `(n_samples, n_features)` 的数组，其中 `n_samples` 表示样本数量，`n_features` 表示特征数量。

- `y`：训练标签，通常是一个形状为 `(n_samples, )` 或 `(n_samples, n_classes)` 的数组，其中 `n_samples` 表示样本数量，`n_classes` 表示类别数量。

- `epochs`：训练轮数，表示模型需要遍历整个训练数据集的次数。

- `batch_size`：批量大小，表示每次训练模型时使用的样本数量。

- `validation_data`：验证数据，通常是一个形状与训练数据相同的数组，用于评估模型在训练过程中的性能表现。

下面是一个使用 `model.fit` 的示例：

import tensorflow as tf

# 创建一个模型
model = tf.keras.Sequential([
    tf.keras.layers.Dense(64, activation='relu', input_shape=(784,)),
    tf.keras.layers.Dense(10, activation='softmax')
])

# 编译模型
model.compile(
    loss = tf.keras.losses.BinaryCrossentropy(),
    optimizer = tf.keras.optimizers.Adam(learning_rate=0.01),
    metrics = ['accuracy']
)

# 训练模型
model.fit(
    Xt, Yt,
    epochs=10,
    batch_size=32,
    validation_data=(Xv, Yv)
)

在上面的示例中，首先使用 `tf.keras.Sequential` 创建一个模型，包含两个全连接层。然后使用 `model.compile` 编译模型，指定损失函数、优化器和评估指标。最后，使用 `model.fit` 训练模型，指定训练数据 `Xt, Yt`，训练轮数 `epochs=10`，批量大小 `batch_size=32`，验证数据 `validation_data=(Xv, Yv)`。训练过程中，模型会根据指定的损失函数和优化器更新模型的参数，并根据指定的评估指标评估模型的性能表现。训练完成后，`model.fit` 会返回训练过程中的损失和指标，可以用于评估模型的性能表现。

批量训练作用

在机器学习中，训练数据通常很大，难以一次性将所有数据加载到内存中进行训练。因此，我们需要将训练数据分成多个批次，每次只加载一部分数据进行训练，这就是批量训练（batch training）。

将训练数据分成多个批次的好处有以下几点：

1. 内存效率更高：将训练数据分批加载到内存中，可以避免由于数据量过大导致内存不足的问题，提高内存的利用效率。

2. 训练速度更快：在每个批次上训练模型可以并行处理，缩短了训练时间，尤其是在使用 GPU 计算加速时，批量训练可以大幅提高训练速度。

3. 模型泛化能力更好：批量训练可以增加模型的泛化能力，避免模型过拟合训练数据。因为每个批次的数据可能来自不同的分布，批量训练可以让模型更好地适应不同的数据分布。

在批量训练中，每个批次的大小是一个重要的超参数，通常称为 `batch_size`。`batch_size` 的大小会影响模型的训练速度和性能表现。较大的 `batch_size` 可以提高训练速度，但可能会导致模型过拟合训练数据，因为每个批次的数据都来自相同的分布。较小的 `batch_size` 可以增加模型的泛化能力，但会增加训练时间和内存消耗。

通常，我们需要根据具体的任务和数据集选择合适的 `batch_size`，以达到最好的训练效果。同时，还可以使用批量训练的技巧，如随机梯度下降（SGD）、批量归一化（Batch Normalization）等来提高模型的性能和泛化能力。

设置训练轮数Epoch的作用

在机器学习中，训练模型是一个迭代的过程，每次迭代会根据训练数据更新模型的参数，使模型能够更好地适应训练数据。因此，我们需要设置迭代的次数，即训练轮数或者称为 epoch。

设置 epoch 的原因有以下几点：

1. 提高模型的泛化能力：通过多次迭代训练数据，可以让模型逐渐适应训练数据的分布，从而提高模型的泛化能力，使其能够更好地适应未知的数据。

2. 避免过拟合：在训练过程中，随着训练轮数的增加，模型可能会逐渐过拟合训练数据，导致在测试数据上的性能下降。因此，需要设置适当的 epoch，使模型能够在训练数据上得到足够的拟合，同时避免过拟合。

3. 控制训练时间和资源消耗：在实际应用中，训练数据可能非常大，模型的训练时间和资源消耗也会相应增加。因此，需要设置适当的 epoch，以控制训练的时间和资源消耗。

需要注意的是，epoch 的设置是一个超参数，需要根据具体的任务和数据集进行调整。通常，我们可以通过观察模型在训练集和验证集上的性能变化，来选择合适的 epoch。当模型在训练集上的性能不再提升或者开始下降时，就可以停止训练，避免过拟合。同时，还可以使用早停策略（Early Stopping）等方法来自动选择合适的 epoch，以达到最好的训练效果。

模型泛化能力是什么

在机器学习中，模型泛化能力（generalization ability）是指模型对未知数据的适应能力。通俗地说，就是模型在训练数据之外的数据上的表现能力。一个具有很好泛化能力的模型，可以在未见过的数据上表现良好，而不仅仅是在训练数据上表现好。

模型泛化能力是机器学习中非常重要的概念，因为我们的目标是构建能够适应未知数据的模型。如果模型只能在训练数据上表现良好，而在未知数据上表现较差，那么它对我们的应用是没有意义的。

有些模型可能会在训练集上表现很好，但是在测试集或者实际应用中表现很差，这种现象称为过拟合（overfitting）。过拟合的原因是模型在训练过程中过度拟合了训练数据，学习到了训练数据的噪声和细节，从而导致在未知数据上的表现不佳。因此，在构建机器学习模型时，除了要关注模型在训练数据上的性能，还需要关注模型的泛化能力，以避免过拟合和提高模型的实用性。

为了评估模型的泛化能力，通常会将数据集分为训练集、验证集和测试集。训练集用于训练模型，验证集用于调整模型的超参数和评估模型的性能，测试集用于最终评估模型的泛化能力。同时，还可以使用交叉验证（Cross Validation）等技术来评估模型的泛化能力，并选择最佳的模型。

Young_IT

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习随记（2）

tf.keras.layers.Normalization` 是 TensorFlow 中的标准化层，它可以将输入数据标准化为均值为 0，方差为 1 的数据。具体来说，`tf.keras.layers.Normalization` 实现了以下操作：1. 对输入数据进行逐个特征的标准化，即对每个特征计算其均值和标准差，然后对该特征进行标准化。2. 可以指定标准化的轴（axis），默认为最后一个轴（即特征轴）。
复制链接

扫一扫