1.LZW压缩适用的场景:
对于有大量重复出现的字符或者字符串,可以将重复出现的多个串用一个字符表示,并写进文件。比如可以压缩这个字符串:“TOBEORNOTTOBEORTOBEORNOT ”,这个字符串中出现了大量的TO,BE,OR,NOT等等字符,我们就可以将这些重复出现的字符压缩写进文件。这里只是说明算法,并没有涉及写进文件的操作。
2.压缩和解压缩的原理:
(1)压缩:这里定义一个字典,字典里存放字符或者字符串的编码。一开始字典被初始化为:
A:1 B:2 C:3 D:4 ..... Y:25 Z:26
之后,出现字母T,我们就将20(ASCII中20对应的字符)写进压缩文件,然后将TO写进字典并编号27.下一个读到字符O,将15写进压缩文件,OB写进字典等等。所以,字典就会被扩充。
TO:27
OB:28