LZSS算法(C语言)

#include <stdio.h>   
#include <stdlib.h>   
#include <string.h>   
#include <ctype.h>   
   
#define N        4096      
#define F          18      
#define THRESHOLD   2      
#define NIL         N      
   
unsigned long int   
        textsize = 0,      
        codesize = 0,      
        printcount = 0;    
unsigned char text_buf[N + F - 1];     
int     match_position, match_length, lson[N + 1], rson[N + 257], dad[N + 1];     
FILE    *infile, *outfile;     
   
void InitTree(void)     
{   
    int  i;   
    for (i = N + 1; i <= N + 256; i++) rson[i] = NIL;   
    for (i = 0; i < N; i++) dad[i] = NIL;   
}   
   
void InsertNode(int r)   
{   
    int  i, p, cmp;   
    unsigned char  *key;   
   
    cmp = 1;  key = &text_buf[r];  p = N + 1 + key[0];   
    rson[r] = lson[r] = NIL;  match_length = 0;   
    for ( ; ; ) {   
        if (cmp >= 0) {   
            if (rson[p] != NIL) p = rson[p];   
            else {  rson[p] = r;  dad[r] = p;  return;  }   
        } else {   
            if (lson[p] != NIL) p = lson[p];   
            else {  lson[p] = r;  dad[r] = p;  return;  }   
        }   
        for (i = 1; i < F; i++)   
            if ((cmp = key[i] - text_buf[p + i]) != 0)  break;   
        if (i > match_length) {   
            match_position = p;   
            if ((match_length = i) >= F)  break;   
        }   
    }   
    dad[r] = dad[p];  lson[r] = lson[p];  rson[r] = rson[p];   
    dad[lson[p]] = r;  dad[rson[p]] = r;   
    if (rson[dad[p]] == p) rson[dad[p]] = r;   
    else                   lson[dad[p]] = r;   
    dad[p] = NIL;    
}   
   
void DeleteNode(int p)    
{   
    int  q;   
       
    if (dad[p] == NIL) return;     
    if (rson[p] == NIL) q = lson[p];   
    else if (lson[p] == NIL) q = rson[p];   
    else {   
        q = lson[p];   
        if (rson[q] != NIL) {   
            do {  q = rson[q];  } while (rson[q] != NIL);   
            rson[dad[q]] = lson[q];  dad[lson[q]] = dad[q];   
            lson[q] = lson[p];  dad[lson[p]] = q;   
        }   
        rson[q] = rson[p];  dad[rson[p]] = q;   
    }   
    dad[q] = dad[p];   
    if (rson[dad[p]] == p) rson[dad[p]] = q;  else lson[dad[p]] = q;   
    dad[p] = NIL;   
}   
   
void Encode(void)   
{   
    int  i, c, len, r, s, last_match_length, code_buf_ptr;   
    unsigned char  code_buf[17], mask;   
       
    InitTree();     
    code_buf[0] = 0;     
    code_buf_ptr = mask = 1;   
    s = 0;  r = N - F;   
    for (i = s; i < r; i++) text_buf[i] = ' ';     
    for (len = 0; len < F && (c = getc(infile)) != EOF; len++)   
        text_buf[r + len] = c;    
    if ((textsize = len) == 0) return;     
    for (i = 1; i <= F; i++) InsertNode(r - i);     
    InsertNode(r);     
    do {   
        if (match_length > len) match_length = len;     
        if (match_length <= THRESHOLD) {   
            match_length = 1;     
            code_buf[0] |= mask;    
            code_buf[code_buf_ptr++] = text_buf[r];    
        } else {   
            code_buf[code_buf_ptr++] = (unsigned char) match_position;   
            code_buf[code_buf_ptr++] = (unsigned char)   
                (((match_position >> 4) & 0xf0)   
              | (match_length - (THRESHOLD + 1)));    
        }   
        if ((mask <<= 1) == 0) {     
            for (i = 0; i < code_buf_ptr; i++)     
                putc(code_buf[i], outfile);        
            codesize += code_buf_ptr;   
            code_buf[0] = 0;  code_buf_ptr = mask = 1;   
        }   
        last_match_length = match_length;   
        for (i = 0; i < last_match_length &&   
                (c = getc(infile)) != EOF; i++) {   
            DeleteNode(s);         
            text_buf[s] = c;   
            if (s < F - 1) text_buf[s + N] = c;     
            s = (s + 1) & (N - 1);  r = (r + 1) & (N - 1);   
            InsertNode(r);     
        }   
        if ((textsize += i) > printcount) {   
            printf("%12ld\r", textsize);  printcount += 1024;   
        }   
        while (i++ < last_match_length) {       
            DeleteNode(s);                     
            s = (s + 1) & (N - 1);  r = (r + 1) & (N - 1);   
            if (--len) InsertNode(r);          
        }   
    } while (len > 0);   
    if (code_buf_ptr > 1) {     
        for (i = 0; i < code_buf_ptr; i++) putc(code_buf[i], outfile);   
        codesize += code_buf_ptr;   
    }   
    printf("In : %ld bytes\n", textsize);      
    printf("Out: %ld bytes\n", codesize);   
    printf("Out/In: %.3f\n", (double)codesize / textsize);   
}   
   
void Decode(void)   
{   
    int  i, j, k, r, c;   
    unsigned int  flags;   
    for (i = 0; i < N - F; i++)
    {
        text_buf[i] = ' ';
    }
    r = N - F;  
    flags = 0;   
    for ( ; ; ) {   
        flags >>= 1;
        if ((flags & 256) == 0) {
            if ((c = getc(infile)) == EOF) 
            { 
                break; 
            }
            flags = c | 0xff00;      
        }  
        if ((flags & 1) !=0) {   
            if ((c = getc(infile)) == EOF)
            {
                break;
            }
            putc(c, outfile);  
            text_buf[r++] = c;  
            r = (r & (N - 1));
        }
        else {
            if ((i = getc(infile)) == EOF) {
                break;
            }
            if ((j = getc(infile)) == EOF)
            {
                break;
            }
            i |= ((j & 0xf0) << 4);  
            j = (j & 0x0f) + THRESHOLD;  
            for (k = 0; k <= j; k++) {   
                c = text_buf[(i + k) & (N - 1)];   
                putc(c, outfile);  
                text_buf[r++] = c; 
                r &= (N - 1);   
            }   
        }   
    }   
}   
   

 

int main()
{
    FILE* result; 
    result = fopen("input", "rb");
    infile = result;
    outfile = fopen("out", "wb");
    
    Encode();

    fclose(infile);  fclose(outfile);
    return EXIT_SUCCESS;
}





  • 2
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
LZSS(Lempel-Ziv-Sliding-Window-Algorithm)是一种用于无损数据压缩的算法。它是基于LZ77算法的改进版本,主要用于压缩文本或者具有重复字符的数据。 LZSS算法的实现可以使用C语言。在这个算法中,首先需要定义两个指针,一个用于查找历史字典窗口中的匹配字符串,另一个用于扫描输入字符串并生成输出编码。 算法的核心步骤如下: 1. 初始化字典窗口和输入字符串的指针。 2. 从输入字符串中取一个字符,并在字典窗口中寻找最长的与之匹配的字符串。 3. 如果找到匹配的字符串,将其以指针(偏移)和长度的形式输出,并将指针移到匹配字符串之后的位置。 4. 如果没有找到匹配的字符串,则将当前字符直接输出,并将指针向前移动一位。 5. 重复步骤2~4,直到输入字符串全部处理完毕。 6. 输出最后的结束标志。 在C语言中,可以使用数组来实现字典窗口和输入字符串的存储。可以定义一个字符数组作为字典窗口,用以保存历史的已编码字符串。同时,也需要定义一个字符数组作为输入字符串。 通过循环遍历输入字符串并比较字典窗口中的字符串,可以找到最长的匹配字符串。然后,根据匹配字符串的指针和长度输出对应的编码。 需要注意的是,为了提高算法效率,可以采用哈希表等数据结构来加速字符串的匹配过程。 总之,LZSS算法是一种用于无损数据压缩的算法,利用历史字典窗口和输入字符串之间的匹配来实现压缩。在C语言中,可以使用数组和循环遍历等基本操作来实现该算法

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

酒与花生米

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值