哈希表模拟后缀数组

 

 改了一个多小时才过,推究其原因是因为cmp函数写错,根据汤神的指点,unsigned long long 

会自动取模,因此,可能会有不相同的数在取模之后大小颠倒了在比较不同的数时候最好不用哈希比较,在比较相同的数的时候使用哈希。

#include<bits/stdc++.h>
using namespace std;
const int sz = 3e6+ 10;
char s[sz];

int n;
int  f1[sz],p[sz],f2[sz];
unsigned long long has1(int l,int r){ return f1[r] - f1[l - 1] * p[r - l + 1];}
unsigned long long has2(int l,int r){ return f2[l] - f2[r + 1] * p[r - l + 1];}
long long  sa[sz];
long long  he[sz];

int get(int i,int j)
{
     int l = 0 , r = max(n - i, n - j);
        while(l < r)
        {
            int mid = (l + r + 1) >> 1;
            if(has1(i, i+ mid - 1) == has1(j, j +mid - 1))l = mid; 
            else r = mid - 1;
        }
    return l;
}

bool cmp(int a,int b)
{
    int l=get(a,b);
    int av=a+l>n?INT_MIN:s[a+l];//当a的遍历位置超过界限时说明b开始的字典序大
    int bv=b+l>n?INT_MIN:s[b+l];
    return av<bv;
}

int main()
{
    scanf("%s",s+1);
     n = strlen(s + 1); 
    p[0] = 1;
    for(int i = 1 ; i <= n ; i++)
    {
        f1[i] = f1[i - 1] * 131 +(s[i]-'a' + 1);
        p[i] = p[i - 1] * 131;
    }
  
   
    for(int i = 1 ; i <= n ; i++)
        sa[i] = i;
    sort(sa + 1,sa + n + 1,cmp);
    for(int i = 1 ; i < n ; i++) cout << sa[i] - 1 <<" ";
    cout << sa[n] - 1;
    cout << endl;
    he[1] = 0;
    for(int i = 2 ; i <= n ; i++)
        he[i] = get(sa[i],sa[i - 1]);
   
    for(int i = 1 ; i < n ; i++) cout << he[i] <<" ";
    cout << he[n] << endl;
    
    
    return 0;
}

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值