“交叉熵”反向传播推导

最新推荐文章于 2024-06-28 13:30:09 发布

zenRRan

最新推荐文章于 2024-06-28 13:30:09 发布

阅读量650

点赞数

文章标签：机器学习深度学习人工智能算法 python

原文链接：https://mp.weixin.qq.com/s?__biz=MzI3ODgwODA2MA==&mid=2247510382&idx=4&sn=9481dbc83e65a9ed5012eab2ad6a6542&chksm=eb53bdfddc2434eb56fc66379630291b3d42b099e808ccd55fe7fb7077dfca3956d3345c9310&scene=126&&sessionid=0

版权

每天给你送来NLP技术干货！

作者 | godweiyang

出品 | 公众号：算法码上来（ID：GodNLP）

- BEGIN -

交叉熵（CrossEntropy）是常见的损失函数，本文详细推导一下它的梯度，面试大厂或者工程实践中都可能会用到。

前向传播

假设分类任务类别数是，隐层输出是维向量，标准的one-hot向量是，正确的类别是。那么交叉熵损失可以定义为：

其中，，是平滑参数。Softmax函数大家都很熟悉了，具体形式为：。

反向传播

对的梯度要分两种情况：

402 Payment Required

推导过程

根据求导法则有：

402 Payment Required

其中就是Softmax函数的梯度（这个推导比较简单，放在了文末）：

下面分两种情况讨论：

当时：

402 Payment Required

当时：

402 Payment Required

Softmax梯度

回顾Softmax函数的形式：

这里也分两种情况讨论：

当时：

当时：

- END -

最近文章

EMNLP 2022 和 COLING 2022，投哪个会议比较好？

一种全新易用的基于Word-Word关系的NER统一模型，刷新了14种数据集并达到新SoTA

阿里+北大 | 在梯度上做简单mask竟有如此的神奇效果

ACL'22 | 快手+中科院提出一种数据增强方法：Text Smoothing，非常简单且有效尤其在数据不足的情况下

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

zenRRan

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

〖TensorFlow2.0笔记12〗误差计算之MSE,Cross Enropy+补充:多类交叉熵反向传播(详细推导)！

AI新视界

04-24

2647

误差计算！文章目录一、误差计算1.1、均方误差-MSE1.2、交叉熵-Entropy1.2.1、二分类的2中方式1.3、为什么不直接MSE而是交叉熵 一、误差计算 1.1、均方误差-MSE 实战演练：代码如下： import tensorflow as tf y = tf.constant([1, 2, 3, 0, 2]) y = tf.one_hot(y, depth=4)...

案例详解cross-entropy交叉熵损失函数及反向传播

BrightLamp的博客

11-13

8353

交叉熵函数的定义: $$ $$

参与评论您还未登录，请先登录后发表或查看评论

反向传播算法推导（交叉熵代价函数-吴恩达机器学习）

jumpe_17的博客

08-13

4757

0. 前言第一次看吴恩达老师机器学习视频时, 在9.29.29.2节卡住。看到评论区别人解答(Arch725 的解答)发现有一些疏漏，而且缺少一些铺垫，所以进行了一些修改补充。本文的反向传播算法的推导过程根据的是交叉熵代价函数，并非二次代价函数。不同代价函数的求导结果不同所以结果略有差异，但本质都是相同的。 交叉熵代价函数: J(Θ)=−1m∑i=1m(y(i)log(hθ(x(i)))+(1−y(i))log(1−hθ(x(i)))) J(\Theta) = -\frac{1}{m}\sum_{i=1

多分类（Softmax）交叉熵损失函数反向传播推导

最新发布

Wilhelm_M的博客

06-28

310

上面这一点也提醒我们，多分类交叉熵损失函数只适用于单标签的多分类任务，不适用于该函数训练多标签分类任务（本人惨痛教训），切记。在上一篇随笔中，我提到了多分类（Softmax）交叉熵损失函数反向传播为。注意到，上式右边偏导数的算法取决于。所求的反向传播，实际上是损失函数。因为对于多分类任务，真实值。是否相等，因此我们将上式分开。，但并未证明，现将证明过程附上。是one-hot向量，所以。

Softmax 与交叉熵损失函数的反向传播公式推导

zhangchaosd的博客

10-09

1766

Softmax 与交叉熵损失函数的反向传播公式推导一、正向传播用一个 X 举例，假设 S 为最后一层全连接层的输出，S 是一个长度为 c 的行向量，其中元素的含义为 c 个类分别的得分，即 s1s_1s1 为 X 在第一个类的得分，以此类推。 S={s1, s2, s3, …, sc}(1) \huge S=\{s_1,\ s_2,\ s_3,\ \dots,\ s_c\}\tag{1} S={s1, s2, s3, …,&n

交叉熵的反向传播梯度推导（使用softmax激活函数）

随风秀舞（diyoosjtu）

04-21

8390

设标签yk=1y_k=1yk=1，也即xkx_kxk对应的第kkk类的标签为1，则交叉熵损失函数为： (1)J=−∑j=1Nyjlog⁡ajL=−log⁡akLJ = -\sum_{j=1}^Ny_j\log a_j^L = -\log a_k^L \tag{1}J=−j=1∑NyjlogajL=−logakL(1) 其中NNN是分类的类别数目。 softmax激活函数的表达式为： (...

机器学习4. 交叉熵损失函数与softmax回归的反向传播推导

xd_ljq的博客

04-15

747

在多分类问题中，一般选取softmax作为分类器，交叉熵作为损失函数。他们的形式都很简单，但是在BP的时候还是有些复杂，现在总结如下： 交叉熵损失函数 (1)C(a,y)=−∑iyilnaiC(a,y)=-\sum_i{y_i ln a_i} \tag{1}C(a,y)=−i∑yilnai(1) softmax逻辑回归第iii个输出值aia_iai为： (2)ai=ezi∑kezka_i...

Softmax 反向传播公式推导

qq_36767053的博客

08-18

2083

深度学习多分类问题中，最后一层通常会用Softmax输出每个类别的概率，然后计算交叉熵损失进行反向传播。 Softmax公式为：当对Softmax函数进行求导时，可以分为两种情况：（1）当 k=ik=ik=i 时：根据sofrmax公式，上式可以化简为：（2）当 k≠ik \neq ik=i 时：上述两种情况加起来便可以得到最终的反向传播公式：参考： https://blog.csdn.net/Charel_CHEN/article/details/81266575 ...

RNN反向传播公式推导.pdf

10-06

RNN反向传播公式推导本文档详细推导了 RNN 反向传播公式，涵盖了模型的前向传播、损失函数、反向传播更新公式的推导。首先，文档介绍了 RNN 模型的前向传播公式，包括输入层、隐层和输出层的计算公式。然后，文档...

反向传播算法推导-全连接神经网络

SIGAI_CSDN的博客

07-07

8995

其它机器学习、深度学习算法的全面系统讲解可以阅读《机器学习-原理、算法与应用》，清华大学出版社，雷明著，由SIGAI公众号作者倾力打造。书的购买链接书的勘误，优化，源代码资源 反向传播算法是人工神经网络训练时采用的一种通用方法，在现代深度学习中得到了大规模的应用。全连接神经网络（多层感知器模型，MLP），卷积神经网络（CNN），循环神经网络（RNN）中都有它的实现版本。算法从多元复合函数求...

matlabauc代码-Reverse-Cross-Entropy:逆交叉熵训练以进行对抗性检测（NeurIPS2018）

05-24

Matlab的耳语反向交叉熵训练反向交叉熵训练（RCE）是一种新颖的训练方法，它可以学习更多区分特征的表示形式以检测对抗性示例。技术细节在以下内容中指定：（NeurIPS 2018）庞天宇，杜超，董银鹏和朱俊训练我们提供有关MNIST和CIFAR-10的培训代码。我们的代码基于。先决条件：安装TensorFlow 1.9.0（Python 2.7）。下载/数据集。如何运行：使用RCE在MNIST上训练ResNet-32的示例： python train.py --train_data_path= ' mnist_dataset/data_train.bin ' \ --log_root=models_mnist/resnet32 \ --train_dir=models_mnist/resnet32/train \ --dataset= ' mnist ' \ --num_gpus=1 \ --num_residual_units=5 \ --mode=train \ --Optimizer= ' mom ' \ --total_steps=20000 \ --

【日常】手写三层反向传播神经网络（损失函数交叉熵+正则项+反向求导）附件

04-28

用于博客代码的说明附件，内附数据集，任务pdf，任务解答代码，jupyter运行结果ipynb的代码报告，以及一份raw_code（代码中有缺块需要补充，用于练手）

『DL笔记』深入理解softmax交叉熵损失函数反向传播求导过程分析

AI新视界

12-12

7593

目录一、softmax 函数二、损失函数 loss function 三、最后的准备工作四、具体的推导过程 s...

神经网络(NN)+反向传播算法（Backpropagation/BP）+交叉熵+softmax原理分析

weixin_33860528的博客

06-12

296

神经网络如何利用反向传播算法进行参数更新，加入交叉熵和softmax又会如何变化？其中的数学原理分析：请点击这里。转载于:https://www.cnblogs.com/code-wangjun/p/9172943.html...

softmax及交叉熵损失的反向传递推导及实现

朗云星空

04-03

4198

一般网络最后一个线性层后面都会跟一个输出层，比如sigmoid,softmax等，其基本做法是将输出Zi取指数再归一化。下面记录一下softmax和交叉熵的反向传递推导。参考博文：https://blog.csdn.net/u014313009/article/details/51045303下面做一个摘录：1. softmax函数及其求导 softmax的函数公式如下： ...

交叉熵损失结合反向传播算法不调包实现逻辑回归

weixin_43217641的博客

04-29

1107

本篇博客手动实现了交叉熵损失下逻辑回归的不调包实现，并且结合具体的二分类数据对代码进行了测试，可视化了不同参数下训练集与测试集的效果，可以帮助读者尽可能熟悉逻辑回归，掌握神经网络的初步搭建.

RNN softmax函数 交叉熵损失公式的反向传播

weixin_45316967的博客

03-05

978

RNN网络中，如果某一步骤有输出值，可采用交叉熵定义其损失函数，下面推导了单步传播时，由y_hat（输出值），y（标签）反向传播时的误差传播公式。按照大叔惯例，依然手动，欢迎交流求得了RNN步传播误差后，就可以进行单步反向传播的推导了。 ...

深度学习入门：反向传播法算法推导与MATLAB实践

"这篇文档主要介绍了神经网络中的反向传播法（Backpropagation）算法的推导及MATLAB代码实现，适合对深度学习有一定基础的读者。文档通过一个具体的例子，带入数值进行演示，帮助理解反向传播法的工作原理。" 反向...