tensorflow学习（一）：关于tensorflow交叉熵损失函数的一些理解

最新推荐文章于 2024-05-20 15:51:55 发布

月半rai

最新推荐文章于 2024-05-20 15:51:55 发布

阅读量2.7k

点赞数

分类专栏： tensorflow

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zlrai5895/article/details/80382076

版权

tensorflow 专栏收录该内容

7 篇文章 0 订阅

订阅专栏

1、tf.nn.softmax_cross_entropy_with_logits(_sentinel=None,labels=None, logits=None, dim=-1, name=None)

sentinel 一般不用 labels 和logits形状相同都是[batch_size,num_classes]

其中labels可以是one-hot的形式，也可以是和为1的概率分布。例如[0.9,0.01,0.09]

本身这个函数就是计算两个概率分布之间的距离。

但是需要注意的是 logits并不是缩放后的和为1的概率分布，而是未经缩放的对数概率。

函数内部会进行两个操作：

（1）logits进行softmax操作

softmax的作用是对输入进来的的分数进行概率归一化

也就是说，输进来n维的得分向量，输出n维的概率分布（和是1）这时候，概率分布的每一个数就代表了confidence，也就是属于该类的概率，或者说置信度。

（2）对得到的概率分布和labels的概率分布计算交叉熵

这个函数最后的输出是一个向量，如果我们想计算损失，就需要求平均值。

tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(_sentinel=None,labels=None, logits=None, dim=-1, name=None))

tf.reduce_mean()用于计算tensor沿着某一个维度的均值，维度可自己设定

tf.reduce_sum()用于计算tensor沿着某一个维度的和，维度可自己设定

如果不指定维度，表示对所有元素进行此操作。

2、tf.nn.sparse_softmax_cross_entropy_with_logits(_sentinel=None,labels=None, logits=None, name=None)

这里labels的形状是[batch_size],logits的形状是[batch_size,num_classes]

不需要再进行one-hot的转变而是在函数内部完成。

需要注意的是 labels 必须从0开始编码取值范围在[0,num_classes)

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
tensorflow学习（一）：关于tensorflow交叉熵损失函数的一些理解

1、tf.nn.softmax_cross_entropy_with_logits(_sentinel=None,labels=None, logits=None, dim=-1, name=None)sentinel 一般不用 labels 和logits形状相同都是[batch_size,num_classes]其中labels可以是one-hot的形式，也可以是和为1的概率分布。...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。