LZSS的笔记

最新推荐文章于 2022-12-12 15:34:39 发布

yusjoel

最新推荐文章于 2022-12-12 15:34:39 发布

阅读量6.1k

点赞数

分类专栏：算法文章标签： byte 算法优化 2010

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yusjoel/article/details/5660628

版权

本文详细解析了LZSS压缩算法，包括编码原理、优化算法及其效率分析，并通过实例展示了算法过程。LZSS使用缓冲区和二叉树结构进行高效匹配，优化算法的时间复杂度为O(n*logN*F)，适合于缓冲区大小N大于64的情况。

摘要由CSDN通过智能技术生成

昨天看了下LZSS.C，就是那个4/6/1989 Haruhiko Okumura的经典代码。

很久没有研究算法了，又没有详细的描述，只能从代码和注释里面去理解。还真花了我不少时间。

首先讲解压，LZSS的编码是1 byte的flag，从低到高，如果bit=1，原样输出1 byte，如果bit=0，读取2 byte，输出长度和缓冲区位置保存在这2 byte中。

其实标准的LZSS我还是第一碰到，以前碰到的多是输出长度和回溯距离的组合。LZSS则多了一个缓冲区，一般大小N = 4096（0x1000），也就是12 bits，缓冲区位置占掉了12 bits，那么输出长度就只能占用4 bits。考虑到bit=0时至少要占用2 bytes，所以输出长度为2时刚刚盈亏平衡，所以一般来说输出长度是从3开始的。在代码中THRESHOLD = 2，意思其实是长度必须大于2。这样的话输出长度的范围就是3-18。代码中F = 18，F就是最大的输出长度。

我碰到到是一个改版，N = 0x800，也就是11 bits，输出长度变成了5 bits，THRESHOLD = 1，最后输出长度的范围是2-33。个人觉得THRESHOLD改成1实在是浪费了一个珍贵的输出长度编码。

用了缓冲区和不用缓冲区的区别，我看就是多了一个字符串，就是缓冲区一开始填充的值。LZSS.C中默认填充的是空格，那么大概是专门为文本文件设计的。一般还是填充0比较多。具体怎么回事下面再描述。

缓冲区的大小N

最低0.47元/天解锁文章

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
3
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

yusjoel CSDN认证博客专家 CSDN认证企业博客

码龄17年

39: 原创

53万+: 周排名

54万+: 总排名

9万+: 访问

: 等级

303: 积分

25: 粉丝

9: 获赞

11: 评论

20: 收藏

私信

关注

热门文章

分类专栏

最新评论

（PS)かまいたちの夜•特別篇汉化笔记八
三千界切那: 感谢大佬
用GetGlyphOutline搞字模
zzllvlv: 请问一下，传入的字符需要事先经过GB2312编码吗？还有就是获得的字符位图缓存是以什么形式存放的呢？
用GetGlyphOutline搞字模
CedarDiao: 感谢楼主分享。图片出处：百度文库搜索 - Windows System字型座标系统是在一篇叫做”Orange2 Design Document“的文档里的。
LZSS的笔记
正方形的花生: 赞一个，之前看LZSS二叉树部分稀里糊涂的，看完LZ的文章有种豁然开朗的感觉~大赞~
(PS)賭博黙示録カイジ汉化笔记（五）(完)
lanshan317: 赞好文！确实当年的遗憾之一，是因为时间原因没有继续完善魔导。现在过去太久，更是难以继续。如果有源码，你觉得会有人去继续维护和完善么？

最新文章

目录

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。