Cross-Entropy（交叉熵）

XSomebody

已于 2022-03-05 15:21:23 修改

阅读量697

点赞数

分类专栏： Deep Learning 文章标签： pytorch 深度学习人工智能 python

于 2022-03-05 12:35:44 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u012582383/article/details/123292530

版权

Deep Learning 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

参考视频：https://www.youtube.com/watch?v=ErfnhcEV1O8

信息论

Entropy

对于一个事件，每传输 1bit 可将不确定度降低一半
对于一个概率为p的事件，需要传递 xbit（编码长度）的数据，有 $p=\frac{1}{2^{x}}$

故Entropy定义为：
$H(p)=-\Sigma_{i} p_{i} \log _{2}\left(p_{i}\right)$
表示传递一个信息样本所需要的最小编码长度

Cross-Entropy:

假设现在有一个样本集中两个概率分布p,q，其中p为真实分布，q为非真实分布。
Cross-Entropy定义为：
$H(p,q)=-\Sigma_{i} p_{i} \log _{2}\left(q_{i}\right)$

其中 $\log _{2}\left(\frac{1}{q_{i}}\right)$ 表示为实际编码长度
故交叉熵表示使用概率分布为q的编码方式传递信息的实际编码长度

深度学习

原理

做softmax后得到q，将label作为p，使用Cross-Entropy，并使该值最小
计算上使用自然对数，简化计算，即 $H(p,q)=-\Sigma_{i} p_{i} \log\left(q_{i}\right)$
在分类任务中，label为one-hot向量，假设 $p_{x}=1$ ，可化简为：
$\log\left(q_{x}\right)$

PyTorch

默认对一个batch中每个数据做Cross-Entropy后取平均值

import torch
import torch.nn as nn
input = torch.randn(3,3)
target = torch.tensor([0,2,1])

法一：NLLLoss

sm = nn.Softmax(dim=1)
loss = nn.NLLLoss()
loss(torch.log(sm(input)), target)

法一：CrossEntropyLoss = Softmax + NLLLoss

loss = nn.CrossEntropyLoss()
loss(input,target)

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Cross-Entropy（交叉熵）

参考视频：https://www.youtube.com/watch?v=ErfnhcEV1O8信息论Entropy对于一个事件，每传输 1bit 可将不确定度降低一半对于一个概率为p的事件，需要传递 xbit（编码长度）的数据，有 p=12xp=\frac{1}{2^{x}}p=2x1故Entropy定义为：H(p)=−Σipilog⁡2(pi)H(p)=-\Sigma_{i} p_{i} \log _{2}\left(p_{i}\right)H(p)=−Σipilog2(pi.
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。