[Codewar练习-java]Burrows-Wheeler-Transformation(BWT压缩算法)

本文介绍了如何使用Java实现Burrows-Wheeler-Transformation(BWT)压缩算法,包括编码和解码过程。编码时,首先获取所有移位字符串的头字符及其索引,然后按ASCII码排序,记录排序后的原始索引。解码时,对输入字符串排序,根据排序结果和原始索引还原字符串。
摘要由CSDN通过智能技术生成

问题:

段位:4

说明:

BWT压缩算法,是先枚举所有字符串移位后,再对移位后的字符串集合排序得出后缀以及原始数组索引的压缩算法,题目要求实现一次压缩算法以及压缩解压算法。

题目连接:

Burrows-Wheeler-Transformation:https://www.codewars.com/kata/54ce4c6804fcc440a1000ecb/train/java

输入案例:

Input: "bananabar"

所有的移位字符串集合:
b a n a n a b a r
r b a n a n a b a
a r b a n a n a b
b a r b a n a n a
a b a r b a n a n
n a b a r b a n a
a n a b a r b a n
n a n a b a r b a
a n a n a b a r b
Then we sort that matrix by its rows. The output of the transformation then is the last column and the row index in which the original string is in:

对字符串进行排序后:
               .-.
a b a r b a n a n
a n a b a r b a n
a n a n a b a r b
a r b a n a n a b
b a n a n a b a r <- 4
b a r b a n a n a
n a b a r b a n a
n a n a b a r b a
r b a n a n a b a
               '-'

Output: ("nnbbraaaa", 4)

我的代码:

首先是编码:

因为文本越长,如果全部字符串列举出来是不可能的,所以

1、先获得所有移位的头字符,以及头字符对应的字符串索引,形成一个头字符集合

2、根据头字符集合进行排序,字符串排序就是根据 ASCII 码表,将每一个字符比较并排序

3、头字符集合排序好之后,按顺序拿集合中头字符对应的字符串索引,然后获取属于移位后最后一个的字符,并记录原始数组的索引。

import java.util.*;
public class BurrowsWheeler {
    private static StringBuilder builder = new StringBuilder();
    public static BWT encode(String s) {
        builder.setLength(0);
        int len = s.length(), index 
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值