C语言经典算法之BWT（Burrows-Wheeler Transform）变换

#include <stdio.h>
#include <string.h>
#include <stdlib.h>

// 假设我们有一个字符数组表示文本
#define CHAR_SET_SIZE 256 // ASCII字符集大小，如果是DNA序列，则可能为4（A,C,G,T）
typedef char TChar;

// 定义一个结构体用于存储轮转后的字符串及其索引
struct StringIndexPair {
    TChar *rotatedString;
    int index;
};

// 函数：对输入文本执行BWT变换
void burrowsWheelerTransform(TChar* input, int length, TChar* output) {
    // 初始化工作区，保存所有轮转后字符串和它们对应的原始索引
    struct StringIndexPair* stringPairs = malloc(length * sizeof(struct StringIndexPair));
    
    // 创建一个新的数组保存每个轮转后的字符串
    for (int i = 0; i < length; ++i) {
        // 轮转字符串
        TChar* rotated = malloc((length + 1) * sizeof(TChar)); // 额外空间存放结束符'\0'
        strncpy(rotated, input + i, length - i);
        strncat(rotated, input, i + 1); // 字符串拼接
        
        // 存储轮转字符串及对应原始位置
        stringPairs[i].rotatedString = rotated;
        stringPairs[i].index = i;
    }

    // 对轮转后字符串按照字典序排序
    qsort(stringPairs, length, sizeof(struct StringIndexPair), compareRotatedStrings);

    /