字符串的最小表示法


一、字符串最小表示的含义

字符串的最小表示即将一个字符串S转换为它与它的循环同构中字典序最小的一个。

什么是循环同构?
即S中存在一个下标i使得 S[i…n-1]+S[0…i-1]=T,则S与T循环同构(将字符串切割为两个子串,将前子串和后子串换位拼接,或者理解为S循环左移或右移)。
打个比方,与字符串"CDAB"循环同构的字符串有"BCDA",“ABCD”,“DABC”,其中字典序最小的是"ABCD",即为这四个字符串的最小表示。

算法的目的是找到S的某个位置,使得以该下标开始循环输出的是它的最小表示。


二、方法步骤

1.设置两个指针(下标)i,j和匹配长度k,初始化i=0,j=1,k=0。

2.比较S[i+k]和S[j+k],这时会出现三种情况:

(1)S[i+k]=S[j+k],则令k++;

(2)S[i+k]>S[j+k]

可以证明:令偏移量p ∈ \in [0,k],S[i+p…i+k]必定不是最小表示串的前缀。
因为根据情况(1),比较的两个字符相等时k会递增,所以对于p<k,有S[i+p]=S[j+p],而S[i+k]>S[j+k],明显以j为起点的字符串表示会更小。

所以最小表示肯定不在S[i…i+k]范围内,于是更新,使i=i+k+1。

(3)S[i+k]<S[j+k]
与步骤二同理,最小表示肯定不在S[j…j+k]范围内,于是更新,使j=j+k+1。

需要注意一点,更新i或者j之后有可能出现i=j的情况,比较同个起点明显是无意义的,所以令i++j++,并且由于起点更新了,两个串要重新开始比较,所以使k=0。

3.循环直到k>=n或i>=n或j>=n,n为字符串S的长度,随后返回min{i,j}即为最小表示的开始位置。

该算法的复杂度为O(n)。

同理的也有最大表示法,在此不再赘述。最小表示法可以找到循环同构的字符串中字典序最小的串,或者为题目给出的具有循环同构性质的多个字符串提供相同的表示,从而借助字符串哈希等实现快速查询。


三、模板

例题:
洛谷-【模板】最小表示法
hdu-Cyclically Isomorphic
UVA-Glass Beads

算法模板:

int minrep(char s[],int n)//返回最小表示的起始位置
{
	
	int i=0,j=1,k=0;
	while(i<n&&j<n&&k<n)
	{
		if(s[(i+k)%n]==s[(j+k)%n])
			k++;
		else
		{
			s[(i+k)%n]>s[(j+k)%n]?i+=k+1:j+=k+1;
			if(i==j)
				i++;
			k=0;
		} 
	}
	return min(i,j);
}
  • 3
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值