TensorFlow四种Cross Entropy算法实现和应用(理论)

Tensorflow交叉熵函数:cross_entropy

以下交叉熵计算函数输入中的logits都不是softmax或sigmoid的输出,因为它在函数内部进行了sigmoid或softmax操作

(一)tf.nn.sigmoid_cross_entropy_with_logits(_sentinel=None, labels=None, logits=None, name=None)

_sentinel:本质上是不用的参数,不用填

labels:一个和logits具有相同的数据类型(type)和尺寸形状(shape)的张量(tensor)

shape:[batch_size,num_classes],单样本是[num_classes]

logits:一个数据类型(type)是float32或float64的张量

name:操作的名字,可填可不填

它对于输入的logits先通过sigmoid函数计算,再计算它们的交叉熵,但是它对交叉熵的计算方式进行了优化,使得结果不至于溢出

它适用于每个类别相互独立但互不排斥的情况:例如一幅图可以同时包含一条狗和一只大象

(二)tf.nn.softmax_cross_entropy_with_logits(_sentinel=None, labels=None, logits=None, dim=-1, name=None)

_sentinel:本质上是不用的参数,不用填

labels:每一行labels[i]必须是一个有效的概率分布,one_hot=True(向量中只有一个值为1,其他值为0)

logits:labels和logits具有相同的数据类型(type)和尺寸(shape)

shape:[batch_size,num_classes],单样本是[num_classes]

name:操作的名字,可填可不填

它对于输入的logits先通过softmax函数计算

它适用于每个类别相互独立且排斥的情况,一幅图只能属于一类,而不能同时包含一条狗和一只大象

(三)tf.nn.sparse_softmax_cross_entropy_with_logits(_sentinel=None, labels=None, logits=None, name=None)

_sentinel:本质上是不用的参数,不用填

labels:shape为[batch_size],labels[i]是[0,num_classes)的一个索引, type为int32或int64,labels是一维的

logits:shape为[batch_size,num_classes],type为float32或float64

name:操作的名字,可填可不填

它适用于每个类别相互独立且排斥的情况,一幅图只能属于一类,而不能同时包含一条狗和一只大象

(四)tf.nn.weighted_cross_entropy_with_logits(labels, logits, pos_weight, name=None)

计算具有权重的sigmoid交叉熵sigmoid_cross_entropy_with_logits()

_sentinel:本质上是不用的参数,不用填

labels:一个和logits具有相同的数据类型(type)和尺寸形状(shape)的张量(tensor)

shape:[batch_size,num_classes],单样本是[num_classes]

logits:一个数据类型(type)是float32或float64的张量

pos_weight:正样本的一个系数

name:操作的名字,可填可不

计算公式: pos_weight*labels * -log(sigmoid(logits)) + (1 - labels) * -log(1 - sigmoid(logits))

使用 TensorFlow 实现图像分类算法需要以下步骤: 1. 准备数据集:准备一个包含图像数据和标签的数据集,通常使用的是标准格式的数据集,如 MNIST、CIFAR-10 等。可以使用 TensorFlow 提供的数据集 API 加载数据集,也可以自行准备数据集并使用 TensorFlow 进行处理。 2. 构建模型:选择合适的模型结构,如卷积神经网络(Convolutional Neural Network, CNN),并使用 TensorFlow 的高级 API,如 Keras、Estimator 或 Layers API,构建模型。 3. 编译模型:设置损失函数、优化器和评估指标,使用 compile() 方法编译模型。 4. 训练模型:使用 fit() 方法训练模型,指定训练数据、批次大小、训练轮数等参数。 5. 评估模型:使用 evaluate() 方法评估模型性能,指定测试数据、批次大小等参数。 6. 预测结果:使用 predict() 方法进行预测,输入待预测数据,输出预测结果。 以下是一个使用 TensorFlow 实现图像分类的代码示例: ```python import tensorflow as tf from tensorflow import keras # 准备数据集 (x_train, y_train), (x_test, y_test) = keras.datasets.cifar10.load_data() # 构建模型 model = keras.Sequential([ keras.layers.Conv2D(32, (3, 3), activation='relu', input_shape=(32, 32, 3)), keras.layers.MaxPooling2D((2, 2)), keras.layers.Flatten(), keras.layers.Dense(10, activation='softmax') ]) # 编译模型 model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy']) # 训练模型 model.fit(x_train, y_train, epochs=10, batch_size=64) # 评估模型 test_loss, test_acc = model.evaluate(x_test, y_test, verbose=2) print('Test accuracy:', test_acc) # 预测结果 predictions = model.predict(x_test) ``` 这段代码中使用的是 CIFAR-10 数据集,构建了一个简单的卷积神经网络模型,使用了 Adam 优化器和 sparse_categorical_crossentropy 损失函数进行模型的训练和编译。训练完成后,使用 evaluate() 方法评估模型性能,使用 predict() 方法进行预测。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值