字符串的最小表示

长度为n的字符串s,其字母序列表示为[0,1,2,…,n-1]。将其循环左移一位变为[1,2,…,n-1,0],记作s(1)。则s(k+1)为s(k)循环左移一位得到。s(0)就是s。一共可以得到n个字符串的集合,{s(0),s(1),…,s(n-1)},称为s的循环同构集合,n个字符串中字典序最小的那个称为集合的最小表示,也称为s的最小表示。如果字符串a、b属于同一个循环同构集合,则说二者是循环同构的,等价于a、b拥有相同的最小表示。
最小表示的基本问题有2类:第一,给定字符串a、b,问是否循环同构;第二,给定字符串a,求其最小表示。
第一类问题可以用KMP来做,令字符串c=aa,即将a重复二次,在c中查找b,如果存在,则说明a、b循环同构,否则否。将序列重复二次,也是解决循环有关问题的一般想法。
第二类问题实际上也不复杂。不过用最小表示的方法两类问题都能解决,而且编码也比较简单。

考虑d1和d2两个长度均为n的字符串,首先将其各自重复二次。则最小表示一定在其中出现。假设d1的最小表示从u开始,d2的最小表示从v开始。从i、j处开始依次比较字母。

如果比较到第k个字母时,i+k大于j+k,说明u一定在i+k的后面。此时将i移到i+k+1,重新与j去比较;如果是i+k小于j+k,则将j做类似处理。如果连续n个字母都相等,则说明这两个字符串是循环同构的。注意,未必是找到了最小表示。例如如果d1和d2本身就是相等的,则从i==0、j==0开始即可匹配,但显然d1、d2未必是最小表示。如果i、j任意一个移到了n以后,则说明这两个字符串不是循环同构。
如果只给定一个字符串a,求其最小表示,同样将其重复二次,然后将i初值设为0,j初值设为1即可。这时找到的也不一定是最小表示。例如当a0大于a1时,就需要将i移至1,则此后都相等了。因此我们需要强制将某个下标再后移一位,直到某个下标已经移出了一倍长度,则另一个下标肯定是最小表示的开始。
hdu2609是典型的最小表示问题。

#include <cstdio>
#include <cstring>
#include <algorithm>
using namespace std;

#define  SIZE 1000001

struct node_t{
    node_t* child[2];
}Node[SIZE];
int toUsed = 1;

//插入单词,单词已存在返回false
bool insert(char const word[]){
    bool ret = false;
    node_t* loc = Node;
    for(int i=0;word[i];++i){
        int sn = word[i] - '0' ;
        if ( !loc->child[sn] ){
            memset(Node+toUsed,0,sizeof(node_t));
            loc->child[sn] = Node + toUsed ++;
            ret = true;
        }
        loc = loc->child[sn];
    }
    return ret;
}
//返回最小表示在s中的序号,s是已经重复二次的字符串
//n为未重复之前的长度
int miniPre(char const s[],int n){
    int i = 0, j = 1;
    int k = 0;
    while( 1 ){
        while( s[i+k] == s[j+k] && k < n ) ++k;
        if ( k == n )return i;//此处可返回i、j任意一个
        if ( s[i+k] > s[j+k] ) i += k + 1;
        else j += k + 1;
        if ( i >= n || j >= n ) return i < j ? i : j;//此处要返回小的
        if ( i == j ) ++j;//强制j后移一位
        k = 0;
    }
    return -1;//这里不会到达
}

char A[205];
int proc(){
    int n = strlen(A);
    copy(A,A+n,A+n);
    A[n+n] = '\0';
    int x = miniPre(A,n);
    A[x+n] = '\0';
    //将最小表示插入字典树
    return insert(A+x) ? 1 : 0;
}
int main(){
    int n;
    while( EOF != scanf("%d",&n) ){
        toUsed = 1;
        memset(Node,0,sizeof(node_t));
        int ret = 0;
        for(int i=0;i<n;++i){
            scanf("%s",A);
            ret += proc();
        }
        printf("%d\n",ret);
    }
    return 0;
}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值