Tensorflow自定义训练(不使用compile,fit)

#------省略了准备数据步骤
# 优化器
optimizer = tf.keras.optimizers.SGD(learning_rate=1e-3)
# 损失函数
loss_fn = tf.keras.losses.CategoricalCrossentropy(from_logits=True)

# 准备metrics函数
train_acc_metric = tf.keras.metrics.CategoricalAccuracy()
val_acc_metric = tf.keras.metrics.CategoricalAccuracy()

# 准备训练数据集
batch_size = 64
train_dataset = tf.data.Dataset.from_tensor_slices((x_train, y_train))
train_dataset = train_dataset.shuffle(buffer_size=1024).batch(batch_size)

# 准备测试数据集
val_dataset = tf.data.Dataset.from_tensor_slices((x_val, y_val))
val_dataset = val_dataset.batch(64)

#开始训练
model = MyModel(num_classes=10)
epochs = 3
for epoch in range(epochs):
    # 遍历数据集的batch_size
    for step, (x_batch_train, y_batch_train) in enumerate(train_dataset):
   # 打开GradientTape以记录正向传递期间运行的操作,这将启用自动区分。
        with tf.GradientTape() as tape:
            logits = model(x_batch_train)
            loss_value = loss_fn(y_batch_train, logits)
        grads = tape.gradient(loss_value, model.trainable_weights) #计算梯度
        optimizer.apply_gradients(zip(grads, model.trainable_weights))# 更新参数

        # 更新训练集的metrics
        train_acc_metric(y_batch_train, logits)     
            
            
    # 在每个epoch结束时显示metrics。
    train_acc = train_acc_metric.result()
    print(float(train_acc))
    print(float(loss_value))
    # 在每个epoch结束时重置训练指标
    train_acc_metric.reset_states()#一定要重置!

    # 在每个epoch结束时运行一个验证集。
    for x_batch_val, y_batch_val in val_dataset:
        val_logits = model(x_batch_val)
        val_acc_metric(y_batch_val, val_logits)
    val_acc = val_acc_metric.result()
    print('Validation acc: %s' % (float(val_acc),))
    val_acc_metric.reset_states()#和上面一样需要充值
TensorFlow中,可以通过定义自定义模型来实现特定的任务。下面是一个简单的示例,展示如何使用TensorFlow定义一个自定义模型。 首先,需要定义一个类来表示模型。该类需要继承自`tf.keras.Model`。例如,下面的类定义了一个具有两个隐藏层和一个输出层的全连接神经网络。 ```python import tensorflow as tf class MyModel(tf.keras.Model): def __init__(self): super(MyModel, self).__init__() self.dense1 = tf.keras.layers.Dense(64, activation='relu') self.dense2 = tf.keras.layers.Dense(64, activation='relu') self.dense3 = tf.keras.layers.Dense(10, activation='softmax') def call(self, inputs): x = self.dense1(inputs) x = self.dense2(x) return self.dense3(x) ``` 在`__init__`方法中,定义了三个全连接层,分别是`dense1`、`dense2`和`dense3`。在`call`方法中,定义了模型的前向传播过程。在这个例子中,输入会首先通过`dense1`和`dense2`层进行处理,然后经过`dense3`层输出。 接下来,需要定义训练过程。可以使用`tf.keras`提供的`compile`方法定义损失函数、优化器和评估指标。 ```python model = MyModel() model.compile(loss='categorical_crossentropy', optimizer=tf.keras.optimizers.Adam(), metrics=['accuracy']) ``` 这里使用了交叉熵损失函数、Adam优化器和准确率评估指标。 最后,可以使用`fit`方法来训练模型。 ```python model.fit(x_train, y_train, epochs=5, batch_size=32) ``` 这里使用训练集`x_train`和标签`y_train`进行训练进行了5轮训练,批大小为32。 这是一个简单的自定义模型的示例,可以根据具体任务需求设计不同的模型。
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值