tensorflow框架基础——交叉熵

本文介绍了TensorFlow框架中的交叉熵概念,作为衡量概率分布差异的指标,并提供了计算公式。同时,讲解了softmax函数,用于将模型输出转换为概率分布。在TensorFlow中,通常使用sparse_softmax_cross_entropy_with_logits计算损失函数,并通过reduce_mean求平均值来评估模型性能。
摘要由CSDN通过智能技术生成

1.交叉熵(Cross Entropy)

表示两个概率分布之间的距离。交叉熵越大,两个概率分布距离越远,两个概率分布越相异。交叉熵越小,两个概率分布越近,两个概率分布越相似。

计算公式:H(y_{-},y)=-\sum y_{-}*log(y)

用tensorflow函数表示为:

ce = -tf.reduce_mean(y_*tf.log(tf.clip_by_value(y,1e-12,1.0)))

tf.clip_by_value(y,1e-12,1.0))表示将y值限制在1e-12和1之间。

 

2.softmax函数

将n分类的n个输出(y1,y2,...yn)变为满足以下概率分布要求的函数:

\forall x P(X=x)\in [0,1]  且  

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
TensorFlow中,可以使用`tf.nn.softmax_cross_entropy_with_logits()`函数来定义交叉熵损失函数。 下面是一个简单的示例: ```python import tensorflow as tf # 定义输入和标签 x = tf.placeholder(tf.float32, [None, 10]) y = tf.placeholder(tf.float32, [None, 10]) # 定义模型 W = tf.Variable(tf.zeros([10, 10])) b = tf.Variable(tf.zeros([10])) logits = tf.matmul(x, W) + b y_pred = tf.nn.softmax(logits) # 定义损失函数 cross_entropy = tf.nn.softmax_cross_entropy_with_logits(labels=y, logits=logits) loss = tf.reduce_mean(cross_entropy) # 定义训练操作 optimizer = tf.train.GradientDescentOptimizer(0.5) train_op = optimizer.minimize(loss) # 训练模型 with tf.Session() as sess: sess.run(tf.global_variables_initializer()) # 训练过程... ``` 在上面的示例中,我们首先定义了输入和标签的占位符。然后,我们定义了一个简单的线性模型,其中权重矩阵W和偏置向量b都初始化为零。接下来,我们使用`tf.nn.softmax_cross_entropy_with_logits()`函数来计算交叉熵损失,然后使用`tf.reduce_mean()`函数将所有样本的损失求平均。最后,我们使用梯度下降优化器来最小化损失函数。 需要注意的是,`tf.nn.softmax_cross_entropy_with_logits()`函数要求我们传递logits和labels参数,其中logits是模型的输出,labels是真实标签。在上面的示例中,我们使用了softmax函数来将logits转换为概率分布,然后将其传递给了`tf.nn.softmax_cross_entropy_with_logits()`函数。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值