2021-01-16交叉熵损失函数比均方误差损失函数优点在哪里

最新推荐文章于 2023-02-18 15:36:38 发布

火星种萝卜

最新推荐文章于 2023-02-18 15:36:38 发布

阅读量870

点赞数 1

分类专栏： AI理论

原文链接：https://blog.csdn.net/dcrmg/article/details/80010342

版权

AI理论专栏收录该内容

206 篇文章 5 订阅

订阅专栏

交叉熵的对比二次方损失

https://blog.csdn.net/u012162613/article/details/44239919

这篇没看懂

https://blog.csdn.net/u014313009/article/details/51043064

分类问题中，预测结果是（或可以转化成）输入样本属于n个不同分类的对应概率。比如对于一个4分类问题，期望输出应该为 g0=[0,1,0,0] ，实际输出为 g1=[0.2,0.4,0.4,0] ，计算g1与g0之间的差异所使用的方法，就是损失函数，分类问题中常用损失函数是交叉熵。

交叉熵（cross entropy）描述的是两个概率分布之间的距离，距离越小表示这两个概率越相近，越大表示两个概率差异越大。对于两个概率分布 p 和 q ，使用 q 来表示 p 的交叉熵为：

由公式可以看出来，p 与 q 之间的交叉熵和 q 与 p 之间的交叉熵不是等价的。上式表示的物理意义是使用概率分布 q 来表示概率分布 p 的困难程序，q 是预测值，p 是期望值。

神经网络的输出，也就是前向传播的输出可以通过Softmax回归变成概率分布，之后就可以使用交叉熵函数计算损失了。

交叉熵一般会跟Softmax一起使用，在tf中对这两个函数做了封装，就是 tf.nn.softmax_cross_entropy_with_logits 函数，可以直接计算神经网络的交叉熵损失。

cross_entropy = tf.nn.softmax_cross_entropy_with_logits(y, y_)

其中 y 是网络的输出，y_ 是期望输出。

针对分类任务中，正确答案往往只有一个的情况，tf提供了更加高效的 tf.nn.sparse_softmax_cross_entropy_with_logits 函数来求交叉熵损失。

均方误差

与分类任务对应的是回归问题，回归问题的任务是预测一个具体的数值，例如雨量预测、股价预测等。回归问题的网络输出一般只有一个节点，这个节点就是预测值。这种情况下就不方便使用交叉熵函数求损失函数了。

回归问题中常用的损失函数式均方误差(MSE,mean squared error)，定义如下：

均方误差的含义是求一个batch中n个样本的n个输出与期望输出的差的平方的平均值。

tf中实现均方误差的函数为：

mse = tf.reduce_mean(tf.square(y_ - y))

在有些特定场合，需要根据情况自定义损失函数，例如对于非常重要场所的安检工作，把一个正常物品错识别为危险品和把一个危险品错识别为正常品的损失显然是不一样的，宁可错判成危险品，不能漏判一个危险品，所以就要在定义损失函数的时候就要区别对待，对漏判加一个较大的比例系数。在tf中可以通过以下函数自定义：

loss = tf.reduce_sum(tf.select(tf.greater(v1,v2),loss1,loss2))

https://blog.csdn.net/dcrmg/article/details/80010342

火星种萝卜

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

火星种萝卜 CSDN认证博客专家 CSDN认证企业博客

码龄17年

303: 原创

2万+: 周排名

227万+: 总排名

434万+: 访问

: 等级

3万+: 积分

428: 粉丝

745: 获赞

323: 评论

2029: 收藏

私信

关注

热门文章

分类专栏

最新评论

jupyter|魔法函数问题| UsageError: Line magic function `%` not found
Song9177: 还真是一下就解决了，感谢
tensorflow1.0代码迁移到2.0官方指导
ivy__w: 请问下把代码改为您文中写的之后报错 tensorflow 中的 disable_resource_variables 函数（位于 D:\Users\anaconda\envs\randlanet\lib\site-packages\tensorflow\python\compat\v2_compat.py 文件的第 96 行）已被弃用，将来会被移除，并给出了更新的指导说明，即长期来看不支持非资源变量。是为什么呀？要怎么解决才行？
假设训练数据集中有10万个词，四元语法需要存储多少词频和多词相邻频率？《动手学深度学习李沐》转
Laughing Man.: 个人见解是：计算机在最开始计算多词相邻概率（包括 n=2 ,n = 3 ,n = 4）的过程是相互独立的，就是计算机分别及计算以上三者并存储，这样考虑根据排列组合的理解就变成了 10万*10万， 10万*10万*10万，10万* 10万*10万*10万(因为可能存在相同的词语相邻) ，所以最后的大小就是 10**2 + 10**3 +10**4 你的理解是在语料库已经建立完毕的情况下，对一条特定的语句需要用到的相邻概率的数量（只有在这种情况下，才会考虑词语已经使用过的情况）
如何理解：先减1后取反和先取反后加1得到的结果是一样的，故仍可采用取反加1的方法，即对于机器数为负数，则有［X］原=［［X］补］补。
做而论道_CS: 求负数 (X < 0) 的 n 位补码，公式是：　[ X ]补＝ 2^n － | X | －－－－－－－－－－－－－－－－－－－－－按照公式来求补码，是非常简单的事。　根本也不涉及什么：符号位原码反码取反加一。例：－31 的八位补码是多少？解： 2^8 － |－31 | 　= 256 － 31 = 225 = 1110 0001 (二进制) 这不就求出来了嘛！但是，有人偏要找麻烦，鼓吹什么 “取反加一” ！那就慢慢算吧。－－－－－－－－－－－－－－－－－－－－－先看，2^n 的二进制，是多少呢？　是：111 ... 1 + 1。（共有 n 个 1，后面再加上一个 1。）再看，| X | 的二进制，又是多少呢？取绝对值后，就是 n 位的正数。可写成：| X | = 0xx ... x。　（共有 n－1 个 x 。）其中的 x，是一位二进制数，即 0 或 1。－－－－－－－－－－－－－－－－－－－－－所以，公式 2^n － | X | 的二进制形式，就是：　　111 ... 1 ＋ 1 － 0xx ... x 。此公式，还可以改写为以下两种形式：　（111 ... 1 － 0xx ... x）＋ 1　　　（1）　　111 ... 1 －（0xx ... x － 1）　　（2）由小学所学的知识，可知：　方程(1) 和方程(2)，是等效的。－－－－－－－－－－－－－－－－－－－－－另外：1 － 0 ＝ 1、1 － 1 ＝ 0。因此：1 － x，　就是对 x 取反。－－－－－－－－－－－－－－－－－－－－－那么，方程 (1)，就是：先取反、后加一；　而，方程 (2)，就是：先减一、后取反。至此，就证明了：　取反加一、减一取反，功能是相同的。证明这个命题，只需用到小学的知识。　根本就不用：原码反码这些乱七八糟的事！
如何理解：先减1后取反和先取反后加1得到的结果是一样的，故仍可采用取反加1的方法，即对于机器数为负数，则有［X］原=［［X］补］补。
做而论道_CS: 先减1后取反、先取反后加1，确实是一样的。但是，证明方法、过程，却不是你写的这些。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。