目录
最小表示法
最小表示法是用于解决字符串最小表示问题的方法。
字符串的最小表示
循环同构
最小表示
字符串 S 的最小表示为与 S 循环同构的所有字符串中字典序最小的字符串
simple 的暴力
我们每次比较 i 和 j 开始的循环同构,把当前比较到的位置记作 k,每次遇到不一样的字符时便把大的跳过,最后剩下的就是最优解。
// C++ Version
int k = 0, i = 0, j = 1;
while (k < n && i < n && j < n) {
if (sec[(i + k) % n] == sec[(j + k) % n]) {
++k;
} else {
if (sec[(i + k) % n] > sec[(j + k) % n])
++i;
else
++j;
k = 0;
if (i == j) i++;
}
}
i = min(i, j);
# Python Version
k, i, j = 0, 0, 1
while k < n and i < n and j < n:
if sec[(i + k) % n] == sec[(j + k) % n]:
k += 1
else:
if sec[(i + k) % n] > sec[(j + k) % n]:
i += 1
else:
j += 1
k = 0
if i == j:
i += 1
i = min(i, j)
随机数据下表现良好,但是可以构造特殊数据卡掉。
我们发现,当字符串中出现多个连续重复子串时,此算法效率降低,我们考虑优化这个过程。
最小表示法
算法核心
时间复杂度
O(n)
算法流程
- i = 0,j = 1,k = 0,表示从 i 开始 k 长度和从 j 开始 k 长度的字符串相同(i,j表示当前判断的位置)
- 当 str[i] == str[j] 时,根据上面 k 的定义,需要进行 k+1 操作
- 当 str[i] > str[j] 时,i 位置比 j 位置上字典序要大,那么不能使用 i 作为开头了,我们要将 i 向后移动,移动多少呢?因为 i 开头和 j 开头的有 k 个相同的字符,那么就执行 i = i + k +1
- 相反str[i] < str[j]时,执行:j = j + k +1
- 若滑动后i == j,因为两个指针指向的内容都一样,则随意选一个加一以保证比较的两个字符串不同,并且重新开始,清空相同长度 k = 0
- 答案为 i, j 中较小的一个
代码
//C语言版
int k = 0, i = 0, j = 1;
while (k < n && i < n && j < n) {
if (s[(i + k) % n] == s[(j + k) % n]) {
k++;
} else {
if(s[(i + k) % n] > s[(j + k) % n])
{
i = i + k + 1;
}else
{
j = j + k + 1;
}
if (i == j) i++;
k = 0;
}
}
i = fmin(i, j);
// C++ Version
int k = 0, i = 0, j = 1;
while (k < n && i < n && j < n) {
if (sec[(i + k) % n] == sec[(j + k) % n]) {
k++;
} else {
sec[(i + k) % n] > sec[(j + k) % n] ? i = i + k + 1 : j = j + k + 1;
if (i == j) i++;
k = 0;
}
}
i = min(i, j);
# Python Version
k, i, j = 0, 0, 1
while k < n and i < n and j < n:
if sec[(i + k) % n] == sec[(j + k) % n]:
k += 1
else:
if sec[(i + k) % n] > sec[(j + k) % n]:
i = i + k + 1
else:
j = j + k + 1
if i == j:
i += 1
k = 0
i = min(i, j)