【字符串压缩】

字符串压缩

package com.wbr.demo;

import lombok.extern.slf4j.Slf4j;
import org.apache.commons.io.FileUtils;
import org.junit.Test;

import java.io.ByteArrayInputStream;
import java.io.ByteArrayOutputStream;
import java.io.File;
import java.io.IOException;
import java.util.Base64;
import java.util.zip.GZIPInputStream;
import java.util.zip.GZIPOutputStream;

/**
 * 字符串压缩
 */
@Slf4j
public class JavaTestHandler {
    @Test
    public void run() throws Exception {
        // 设置文件路径
        String pathDir = "D:\\Users\\lei\\Desktop\\";
        // 读取文件内容为字符串
        String inputString = FileUtils.readFileToString(new File(pathDir + "max.log"));

        // 将字符串转换为字节数组
        byte[] input = inputString.getBytes("UTF-8");

        // 创建一个字节数组输出流,用于接收压缩后的数据
        ByteArrayOutputStream outputStream = new ByteArrayOutputStream();
        GZIPOutputStream gzipOut = new GZIPOutputStream(outputStream);

        // 将数据压缩到输出流中
        gzipOut.write(input);
        gzipOut.close();

        // 获取压缩后的字节数组
        byte[] compressed = outputStream.toByteArray();

        // 将压缩后的字节数组转换为字符串(使用Base64编码)
        String compressedString = Base64.getEncoder().encodeToString(compressed);
        // 将压缩后的字符串写入文件
        FileUtils.write(new File(pathDir + "after.log"), compressedString);

        // 解压缩示例(可选)
        byte[] decompressed = decompress(compressed);
        String originalString = new String(decompressed, "UTF-8");
        // 将解压缩后的字符串写入文件
        FileUtils.write(new File(pathDir + "afterXX.log"), originalString);
    }

    // 解压缩方法
    public static byte[] decompress(byte[] compressed) throws IOException {
        // 创建一个字节数组输入流,用于读取压缩数据
        ByteArrayInputStream inputStream = new ByteArrayInputStream(compressed);
        ByteArrayOutputStream outputStream = new ByteArrayOutputStream();
        GZIPInputStream gzipIn = new GZIPInputStream(inputStream);

        // 读取压缩数据并写入输出流
        byte[] buffer = new byte[1024];
        int len;
        while ((len = gzipIn.read(buffer)) != -1) {
            outputStream.write(buffer, 0, len);
        }

        gzipIn.close();
        outputStream.close();

        return outputStream.toByteArray();
    }
}

压缩后比较

这里经过测试,发现文件越大,效果越明显。

  • 3
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 可以使用Python的gzip库来进行字符串压缩。下面是一个简单的例子: ```python import gzip string = "This is a test string to be compressed." compressed_data = gzip.compress(bytes(string, 'utf-8')) ``` 在上面的例子中,首先将原始字符串转换为字节串,然后使用gzip.compress()函数进行压缩压缩后的数据将存储在compressed_data变量中。 要解压缩数据,可以使用gzip.decompress()函数,如下所示: ```python decompressed_data = gzip.decompress(compressed_data) print(decompressed_data.decode('utf-8')) ``` 在上面的例子中,使用gzip.decompress()函数将压缩后的数据解压缩,并使用decode()函数将结果转换为字符串。 ### 回答2: Python中的字符串压缩是指将一个字符串中连续重复的字符进行压缩,以减少字符串的长度。例如,字符串"AAABBBCCC"可以压缩为"3A3B3C"。 实现字符串压缩的方法是使用两个指针,一个指针用来记录当前重复字符的起始位置,另一个指针用来遍历整个字符串。通过比较两个指针指向的字符,如果相同则将第二个指针向后移动一位,直到找到不同的字符,此时将重复字符的个数和字符本身拼接起来,并更新第一个指针为当前字符。重复上述步骤直到遍历完整个字符串。 下面是一个示例代码实现: ```python def compress_string(s): if not s: return s compressed = "" count = 1 pointer = 0 for i in range(1, len(s)): if s[i] == s[pointer]: count += 1 else: compressed += str(count) + s[pointer] count = 1 pointer = i compressed += str(count) + s[pointer] if len(compressed) >= len(s): return s else: return compressed # 测试 s = "AAABBBCCC" compressed = compress_string(s) print(compressed) # 输出:"3A3B3C" ``` 需要注意的是,压缩后的字符串长度应小于原始字符串才能进行压缩,否则直接返回原始字符串。在上述代码中,我们使用了一个`compressed`变量来存储压缩后的字符串,`count`用于记录重复字符的个数,`pointer`指向当前重复字符的起始位置。最后,利用`len()`函数比较压缩前后字符串的长度,选取合适的返回值。 希望以上回答对您有所帮助! ### 回答3: Python字符串压缩是指对字符串进行压缩,以减小字符串的存储空间或传输带宽的占用。在Python中,常用的字符串压缩方法包括压缩算法和压缩模块。 1. 压缩算法: - Run Length Encoding (RLE):这是最简单的压缩算法之一,它通过将连续相同字符替换为一个字符和出现次数的计数来压缩字符串。例如,字符串"AAAABBBCCCCCC"可以被压缩为"A4B3C6"。 - Huffman压缩:它通过根据字符频率构建一个最优二叉树来压缩字符串,出现频率高的字符使用较短的编码,出现频率低的字符使用较长的编码。 2. 压缩模块: - gzip模块:这是Python的内置模块,用于压缩和解压缩文件和数据流。使用gzip模块,可以将字符串压缩为gzip格式的文件,或者将gzip格式的文件解压缩字符串。 - zlib模块:这也是Python的内置模块,提供了对数据和字符串进行压缩和解压缩的功能。使用zlib模块,可以将字符串压缩为zlib格式的数据,或者将zlib格式的数据解压缩字符串。 在实际应用中,我们可以根据具体的需求选择合适的压缩方法。例如,如果字符串中存在连续重复的字符较多,可以选择RLE算法进行压缩;如果需要将字符串存储为文件或通过网络传输,可以选择gzip或zlib模块进行压缩压缩后的字符串可以通过相应的解压缩方法进行恢复原始字符串。总之,Python提供了丰富的字符串压缩方法,可以根据具体情况选择最合适的方法进行压缩和解压缩操作。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值