java实现lz77算法_【数据压缩】LZ77算法原理及实现

最新推荐文章于 2021-02-27 03:07:29 发布

weixin_39666550

最新推荐文章于 2021-02-27 03:07:29 发布

阅读量902

点赞数

文章标签： java实现lz77算法

本文链接：https://blog.csdn.net/weixin_39666550/article/details/114249367

版权

LZ77算法是一种基于数据重复结构的压缩方法，由Ziv和Lempel在1977年提出。通过使用滑动窗口和查找历史字符串来创建词典，对数据进行压缩。算法通过找到最长匹配来编码，Java实现中包括`longest_match`函数来寻找匹配，并提供了压缩和解压缩功能。解压缩过程确保与压缩时的滑动窗口大小相同，以正确还原信息。

摘要由CSDN通过智能技术生成

1. 引言

LZ77算法是采用字典做数据压缩的算法，由以色列的两位大神Jacob Ziv与Abraham Lempel在1977年发表的论文《A Universal Algorithm for Sequential Data Compression》中提出。

基于统计的数据压缩编码，比如Huffman编码，需要得到先验知识——信源的字符频率，然后进行压缩。但是在大多数情况下，这种先验知识是很难预先获得。因此，设计一种更为通用的数据压缩编码显得尤为重要。LZ77数据压缩算法应运而生，其核心思想：利用数据的重复结构信息来进行数据压缩。举个简单的例子，比如

取之以仁义，守之以仁义者，周也。取之以诈力，守之以诈力者，秦也。

取之以、仁义、，、者、守之以、也、诈力、。均重复出现过，只需指出其之前出现的位置，便可表示这些词。为了指明出现位置，我们定义一个相对位置，如图

相对位置之后的消息串为取之以诈力，守之以诈力者，秦也。，若能匹配相对位置之前的消息串，则编码为以其匹配的消息串的起始与末端index；若未能匹配上，则以原字符编码。相对位置之后的消息串可编码为：[(1-3),(诈力),(6),(7-9),(诈力),(12),(6),(秦),(15-16)]，如图所示：

上面的例子展示如何利用索引值来表示词，以达到数据压缩的目的。LZ77算法的核心思想亦是如此，其具体的压缩过程不过比上述例子稍显复杂而已。

2. 原理

本文讲主要讨论LZ77算法如何做压缩及解压缩，关于LZ77算法的唯一可译、无损压缩(即解压可以不丢失地还原信息)的性质，其数学证明参看原论文[1]。

滑动窗口

至于如何描述重复结构信息，LZ77算法给出了更为确切的数学解释。首先，定义字符串\(S\)的长度为\(N\)，字符串\(S\)的子串\(S_{i,j},\ 1\le i,j \le N\)。对于前缀子串\(S_{1,j}\)，记\(L_i^j\)为首字符\(S

最低0.47元/天解锁文章

weixin_39666550

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫