神经网络笔记 - 交叉熵续

最新推荐文章于 2020-02-04 19:28:31 发布

volvet

最新推荐文章于 2020-02-04 19:28:31 发布

阅读量398

点赞数 1

分类专栏：机器学习文章标签：神经网络

本文链接：https://blog.csdn.net/volvet/article/details/73028525

版权

机器学习专栏收录该内容

29 篇文章 1 订阅

订阅专栏

为什么选择交叉熵(Why Cross-Entropy)

为了解决学习速度下降的问题,我们希望

\partial C \partial w j = x j (a - y)

$\frac{\partial C}{\partial w_j}=x_j(a-y)$

\partial C \partial b = (a - y)

$\frac{\partial C}{\partial b} = (a-y)$

如上文所述, 当代码函数为 $C$ 时:

\partial C \partial b = \partial C \partial a δ' (z)

$\frac{\partial C}{\partial b}=\frac{\partial C}{\partial a}\delta^{'}(z)$
因为

δ $\delta$ 函数的性质:

δ' (z) = (1 - δ (z)) δ (z) = a (1 - a)

$\delta^{'}(z)=(1-\delta(z))\delta(z)=a(1-a)$
于是:

\partial C \partial b = \partial C \partial a a (1 - a)

$\frac{\partial C}{\partial b}=\frac{\partial C}{\partial a}a(1-a)$
如果要符合期望, 则下式必须成立:

\partial C \partial a = a - y a ( 1 - a )

$\frac{\partial C}{\partial a}=\frac{a-y}{a(1-a)}$
则反推可以得到

C = - [y ln a + (1 - y) ln (1 - a)] + c o n s t a n t

$C = -[y\ln a + (1-y)\ln(1-a)] + constant$
这是一个样本的代价函数, 多个样本的话, 自然

C = - 1 n \sum x [y ln a + (1 - y) ln (1 - a)] + c o n s t a n t

$C = -\frac{1}{n}\sum_x[y\ln a + (1-y)\ln(1-a)] + constant$

Reference

http://neuralnetworksanddeeplearning.com/

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

volvet

关注关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

神经网络笔记 - 交叉熵(Cross-Entropy)

闲敲棋子落灯花

05-29

3805

如上文所述, 如果我们使用均方误差来考量学习误差 C=12n∑x||y(x)−aL(x)||2 C = \frac{1}{2n}\sum_x||y(x)-a^L(x)||^2 则有 ∂C∂w=(a−y)σ′(z) \frac{\partial C}{\partial w}=(a-y)\sigma^{'}(z) ∂C∂b=(a−y)σ′(z) \frac{\partial C}{\part

TensorFlow笔记-06-神经网络优化-损失函数自定义损失函数 交叉熵

qq_44906554的博客

04-13

690

TensorFlow笔记-06-神经网络优化-损失函数自定义损失函数 交叉熵

参与评论您还未登录，请先登录后发表或查看评论

softmax回归与经典BP神经网络

07-29

本ppt讲解了softmax回归的推导由来来龙去脉和BP算法的推导，以及softmax回归在深度学习中的应用

Softmax函数与交叉熵

qq_25295407的博客

11-22

282

好文记录 http://blog.csdn.net/behamcheung/article/details/71911133

softmax 交叉熵损失函数

小沫_jie的博客

03-13

657

转载自：http://blog.csdn.net/willduan1/article/details/73694826

[深度学习]Softmax 交叉熵

nwpuxhld

09-16

605

交叉熵代表的是不同概率分布的相似情况,他的计算方法如下所示：其中ｙ代表的是每种类比出现的概率 cross\_entropy = -\sum y * log(y) 对于深度学习中的分类问题来说，当分类越准确的时候，上述值就越小。但是对于神经网络来说，怎么把一个神经网络的输出转化成相应的概率呢？这就是我们接下来要说的softmax函数的作用 softmax函数的定义如下所示：我们可以看到sof

神经网络学习笔记-神经网络基础（三）

最新发布

03-31

本笔记主要聚焦于神经网络的基础概念，包括神经元模型、网络结构、激活函数、损失函数以及优化算法等核心元素。首先，神经元是神经网络的基本构建单元。它模仿生物神经元的工作方式，接收输入信号，通过加权求和后...

CS231n课程笔记翻译：神经网络笔记 2 - 知乎专栏1

08-03

【神经网络笔记 2】 神经网络是机器学习领域中一种强大的模型，用于处理各种复杂的分类和回归任务。在本篇笔记中，我们将深入探讨神经网络的一些关键方面，包括数据预处理、权重初始化以及批量归一化等技术。 **...

【Tensorflow与深度学习笔记day07】5.2. ANN网络分析+Mnist手写数字识别+one-hot编码+SoftMax回归+损失计算-交叉熵损失+实现神经网络模型+模型正确率评估

汪雯琦的博客

02-04

1098

文章目录5.2. ANN网络分析Mnist手写数字识别one-hot编码SoftMax回归损失计算-交叉熵损失实现神经网络模型获取数据计算数据梯度下降优化与训练模型正确率评估跟踪变量完整代码： 5.2. ANN网络分析 Mnist手写数字识别 Mnist数据集可以从官网下载，网址： http://yann.lecun.com/exdb/mnist/ 下载下来的数据集被分成两部分：55000行的训...

干货 | 深度学习之损失函数与激活函数的选择

机器学习算法与Python学习

09-19

4986

softmax算法与损失函数的综合应用

qq_40652148的博客

05-27

2528

6.5 softmax 算法与损失函数的综合应用在神经网络中使用 softmax 计算 loss 时对于初学者常常会范很多错误，下面通过具体的实例代码演示需要注意哪些关键的地方与具体的用法。6.5.1 实例 22 交叉熵实验对于交叉熵这个比较生僻的术语，在深度学习领域中是最常见不过了，由于其常用性，在TensorFlow 中会被封装成为多个版本，有的公式里直接带了交叉熵，有的需要自己单独求一下交...

BP神经网络误差反向传播公式简单推导

绯荔榭•少年

10-31

4330

最近看了BP神经网络(Back Propagation Neural Networks)，对于其中误差反向传播公式的推导比较困惑，在参考周志华老师的《机器学习》和网上一些博客后，做出一个简单的还原。 1. BP网络模型及变量说明 1.1 模型简图 1.2 变量说明： ml：第l层神经元个数 x(1)p: 输入层第p个神经元，p=1…m1； yk : 输出层第k的神经元的输

9.1 mnist_softmax 交叉熵多分类器

FontTian的博客

10-23

1324

softmax交叉熵多分类器具体含义不再解释,这是一个我们比较常用的一个多分类器.深度学习的一大优点就是特征的自动构建,也正是因为该优点,使得分类器层显得不再那么重要,在Tensorflow的官方源码中,softmax是很常见的一个多分类器.其调用也十分的简单.此处再此单独拿出来介绍,是为了下一步的学习做准备.使用方法 cross_entropy = tf.reduce_mean( t

BP神经网络数学原理及推导过程

vinsuan93的专栏

10-18

4907

说明：本博客引自博客：http://blog.csdn.net/zhongkejingwang/article/details/44514073；并对此博客中有些地方的推导的过程进行详细地说明。同时，对一些基础知识进行引申介绍。 1.引言 BP神经网络，BP即Back Propagation的缩写，也就是反向传播的意思。它是一种前馈神经网络。而前馈神经网络是神经网络的一种典型分层结构,在这种网

Sigmoid 与Softmax 作为网络输出层的激活函数及分别对应的交叉熵损失函数

qq_37342061的博客

08-28

3311

网络最后一层的激活函数都是为了将输出的数据明显的区分开。 1、Sigmoid 数学式子：导数：绘图：（口诀 5点3线）代码： import matplotlib.pylot as plt import numpy as np def Sigmoid(x): return 1.0/(1.0+ np.exp(-x)) def PlotSigmoid(): ...

交叉熵与softmax的初步了解

fish_like_apple的博客

03-23

507

前言：在调试tensorflow官方教程代码时，我发现了交叉熵（Cross Entropy）损失和其之前所用的softmax函数。我还没在《神经网络与机器学习第3版》中看到交叉熵，就大概先了解一下，并且记录下我目前了解到的信息。正文：先说交叉熵的公式：如果是在训练神经网络的情况下，p(i)代表标签中当前样本属于i类的概率。在mnist的标签中此项非1即0，而且只有某一类对应的概率是1，其他都是...

神经网络中的softmax函数

u010601901的博客

07-07

8482

Softmax function 1 提出背景对于一般的神经网络而言，误差函数为,但是这样的误差函数是会存在问题的：（1）对于互斥分类问题的概率求解问题，必须要保证,但是如果采用上述的误差函数，是没有办法保证的（2）对于分类问题，实际的结果是1，但是预测的结果是0.0000001，即好比实际的结果在x轴方向的，但是预测的结果却是y轴方向。那么，在缩小误差的过程中，就需要相当长

深度学习基石：CS231n神经网络笔记2-数据预处理与模型设定

"这篇是斯坦福大学CS231n课程关于神经网络的笔记第二部分，主要涵盖了数据预处理、权重初始化、批量归一化、正则化、损失函数等关键概念。译者对原文进行了翻译和校对，旨在帮助读者深入理解神经网络的构建和优化...