关于交叉熵

最新推荐文章于 2024-08-09 13:44:55 发布

今晚打佬虎

最新推荐文章于 2024-08-09 13:44:55 发布

阅读量1.8k

点赞数

文章标签：交叉熵

在信息论中可以根据香农熵估计一个字符串中每个符号$S_{i}$编码所需的最小位数，前提是每个字符出现的概率$P_{i}$是已知的．

$H = - \sum_{i}(P_{i}\times log_{2}(P_{i}))$

举个例子：
比如，ＡＰＰＬＥ这个单词的香农熵：

每个字符在字符串中出现的概率：
　　　　 $P_{A} = P_{L} = P_{E} = \frac{1}{5} = 0.2$
　　　　 $P_{L} = \frac{2}{5} = 0.4$
信息熵：
　　　　 $H = -3 \times 0.2 \times log_{2}(0.2) - 0.4 \times log_{2}(0.4) = 1.92193$
　　　　所以在采取最优编码时，＇APPLE’中的每个字符需要２位．
在对符号进行编码时，如果假设了其他概率 $q_{i}$ 而不是真实概率 $P_{i}$ ,则每个符号的编码长度会增加，可以采用一种次优的编码方案对同一个字符串进行计算编码所需的平均最小位数．

$H = - \sum_{i}(P_{i}\times log_{2}(q_{i}))$

例如，ASCII对ＡＰＰＬＥ中的每一个字符赋予的概率是相同的 $q_{i} = \frac{1}{256}$
在采用ASCII编码时，APPLE的信息熵：
$H = - 3 \times 0.2 \times log_{2}(\frac{1}{256}) - 0.4 \times log_{2}(\frac{1}{256}) = 8$
所以在ASCII编码对每个字符编码为８位
在采用交叉熵构建损失函数时候，Ｐ为期望的输出和概率分布，即实际的概率分布．ｑ为模型计算得到的输出．根据上面的例子：当 $P_{i} = q_{i}$ 时，得到的熵最小．所以利用交叉熵来比较两个分布的吻合情况，非常合适，交叉熵越小，模型的输出就越接近真实的概率分布．

今晚打佬虎

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

今晚打佬虎 CSDN认证博客专家 CSDN认证企业博客

码龄11年

283: 原创

7003: 周排名

3万+: 总排名

103万+: 访问

: 等级

8488: 积分

8875: 粉丝

581: 获赞

374: 评论

2372: 收藏

私信

关注

热门文章

分类专栏

最新评论

NLP：训练一个中文问答模型Ⅰ
it972449665: 请问这个报错要怎么处理：报错代码：return start_tokens, done, self.rnn.get_initial_state(embedded)[0] 报错：发生异常: InvalidArgumentError {{function_node __wrapped__Pack_N_2_device_/job:localhost/replica:0/task:0/device:CPU:0}} Shapes of all inputs must match: values[0].shape = [64,1,256] != values[1].shape = [] [Op:Pack] name: TypeError: only integer scalar arrays can be converted to a scalar index During handling of the above exception, another exception occurred: tensorflow.python.eager.core._NotOkStatusException: InvalidArgumentError: {{function_node __wrapped__Pack_N_2_device_/job:localhost/replica:0/task:0/device:CPU:0}} Shapes of all inputs must match: values[0].shape = [64,1,256] != values[1].shape = [] [Op:Pack] name:
声音克隆指南
小方abc: 真的很不错写的很清晰，流程图说的很清楚。
如何从零开始训练一个语言模型
今晚打佬虎: github搜minimind，2G显存训练一个miniMOE专家混合模型
如何从零开始训练一个语言模型
今晚打佬虎: 可以啊，纯粹体验过程，训练一个Tiny-toy-LLM。有NLP基础的话，github资料很多，一般都有预训练和监督微调的过程。
如何从零开始训练一个语言模型
summer_du: 你好，博主。有没有详细的学习资料？我没有大模型基础。想从0搭建一套简单的训练模型。请问可以吗

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。