Huffman编码

最新推荐文章于 2023-11-30 15:01:22 发布

吨一桶水果茶

最新推荐文章于 2023-11-30 15:01:22 发布

阅读量923

点赞数 1

文章标签： huffman tree

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_67361769/article/details/124841693

版权

数据通信中，需要将传送的文字转换成二进制的字符串，用01的不同排列表示字符。二进制编码大致有两种方式：等长编码和变长编码。

等长编码即所有字符的编码长度相同，如果有6个字符，那么就需要3位二进制（）。由于等长编码对于所有字符的编码长度相同，因此对于一些出现频率极高的字符来说，等长编码会造成数据压缩率不高。

变长编码可以达到比等长编码好的多的压缩率，其思想就是赋予高频词短编码，低频词长编码。变长编码中我们只考虑『前缀编码』，即一个字符的编码不能是另一个字符编码的前缀。

因此，我们可以用字符集中的每个字符作为叶子节点生成一颗编码二叉树，为了获得传送报文的最短长度，可以将每个字符的出现频率作为字符节点的权值赋予该结点上，然后构造一棵Huffman树。利用Huffman树设计的二进制前缀编码，就被称为Huffman编码。

那么这两篇博客介绍了Huffman树和Huffman编码，是为了给接下来要学的word2vec做铺垫，因为Word2vec算法也用了Huffman编码，它把训练语料中的词当成叶子节点，其在语料中出现的次数当做权值，通过构造响应的Huffman树来对每一个词进行Huffman编码。

吨一桶水果茶

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Huffman编码

数据通信中，需要将传送的文字转换成二进制的字符串，用01的不同排列表示字符。二进制编码大致有两种方式：等长编码和变长编码。等长编码即所有字符的编码长度相同，如果有6个字符，那么就需要3位二进制（）。由于等长编码对于所有字符的编码长度相同，因此对于一些出现频率极高的字符来说，等长编码会造成数据压缩率不高。变长编码可以达到比等长编码好的多的压缩率，其思想就是赋予高频词短编码，低频词长编码。变长编码中我们只考虑『前缀编码』，即一个字符的编码不能是另一个字符编码的前缀。因此，我们可以用字符集中的每个字符
复制链接

扫一扫

吨一桶水果茶 CSDN认证博客专家 CSDN认证企业博客

码龄2年

13: 原创

93万+: 周排名

211万+: 总排名

7654: 访问

: 等级

131: 积分

0: 粉丝

1: 获赞

0: 评论

1: 收藏

私信

关注

热门文章

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。