霍夫曼编码的三个缺点

最新推荐文章于 2023-06-24 09:24:59 发布

知堂织韵

最新推荐文章于 2023-06-24 09:24:59 发布

阅读量4k

点赞数 2

分类专栏：笔记文章标签：霍夫曼树

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/proorck2019/article/details/123583091

版权

笔记专栏收录该内容

81 篇文章 0 订阅

订阅专栏

霍夫曼编码是理论上最优的压缩编码，适用于压缩，并不适用于字符编码。将unicode中的100多万个字符统一使用霍夫曼编码，是个不成熟的设想。具体分析，它有三个缺点。
一、对起点敏感。需要从文本的开头处解码，才能得到正确的结果。不能从半路开始解码，如果文本很长，也要从开始处解码。
二、暴露语言的“指纹”。这个指纹指的是密码学中的概念，例如英语中字母e出现的频率高，那么，在加密解密过程中，这就是个漏洞。很有可能从字符的频率出发，破解密码。
三、字符顺序乱了。用正则表达式处理0-9，a-z，仅需做数字加减法就行了。但是，经过霍夫曼编码之后，顺序乱了，不能再简单的处理文本了。
以上三个缺点，导致霍夫曼编码仅仅用于压缩，不能用于字符编码。

关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
霍夫曼编码的三个缺点

霍夫曼编码是理论上最优的压缩编码，适用于压缩，并不适用于字符编码。将unicode中的100多万个字符统一使用霍夫曼编码，是个不成熟的设想。具体分析，它有三个缺点。一、对起点敏感。需要从文本的开头处解码，才能得到正确的结果。不能从半路开始解码，如果文本很长，也要从开始处解码。二、暴露语言的“指纹”。这个指纹指的是密码学中的概念，例如英语中字母e出现的频率高，那么，在加密解密过程中，这就是个漏洞。很有可能从字符的频率出发，破解密码。三、字符顺序乱了。用正则表达式处理0-9，a-z，仅需做数字加减法就行了
复制链接

扫一扫

专栏目录

知堂织韵 CSDN认证博客专家 CSDN认证企业博客

码龄5年

166: 原创

1万+: 周排名

1万+: 总排名

13万+: 访问

: 等级

2279: 积分

477: 粉丝

311: 获赞

32: 评论

277: 收藏

私信

关注

热门文章

分类专栏

最新评论

编译原理：代替LR分析法的MP分析法
凯子坚持 c: 博主的文章总是带着深思熟虑，给予我新的学识，每篇博客都是一次心灵的洗礼，你的分享不仅教育了我，也丰富了我的内心世界。期待你的未来更新，继续前行！
公共命名空间简述，实现自然语言编程的必经之路
凯子坚持 c: 博主的文章总是带着深思熟虑，给予我新的学识，每篇博客都是一次心灵的洗礼，你的分享不仅教育了我，也丰富了我的内心世界。期待你的未来更新，继续前行！
密码学：用随机函数隐藏指纹
知堂织韵: 地球人都知道
文本和二进制混合存储
知堂织韵: 谢谢评论
文本和二进制混合存储
凯子坚持 c: 好文好闻✨ 　　　 🎊＞　フ　　　　　| 💖 💖 　　　　／` ミ＿꒳ノ　　　 /　　　　 | 　　　 /　ヽ　　ﾉ　　 │　　|　|　| 　／￣|　　 |　|　| 　| (￣ヽ＿_ヽ_)__) 　＼二つ

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。