字符串哈希 - poj - 2774 最长公共子串(连续)+用二分查找替代map的判断重复方法

题目链接:http://poj.org/problem?id=2774
题目大意:就是求两个字符串的最长公共字串。
二分长度,然后暴力哈希,map判断是否重叠竟然T了。

然后把第一个串的长度为mid的子串加入vector。对于模式串的子串只要二分查找是否存在vector中就行了。巧妙的优化方法。

#include<bits/stdc++.h>
#define ull unsigned long long
using namespace std;
ull base =131;

char s1[100005];
char s2[100005];

ull g[100005];
ull p[100005];
ull g1[100005];

ull Hash(char s[])
{
    int len=strlen(s);

    g[0]=s[0];
    for(int i=1;i<len;i++)
    {
        g[i]=g[i-1]*base+s[i];
    }
    return g[len-1];
}

ull Hash1(char s[])
{
    int len=strlen(s);

    g1[0]=s[0];
    for(int i=1;i<len;i++)
    {
        g1[i]=g1[i-1]*base+s[i];
    }
    return g1[len-1];
}

void getp()
{
    p[0]=1;
    for(int i=1;i<=100005;i++)
    {
        p[i]=p[i-1]*base;
    }
}

ull getLR(int l, int r)
{
    return g[r]-g[l-1]*p[r-l+1];
}

ull getLR1(int l, int r)
{
    return g1[r]-g1[l-1]*p[r-l+1];
}


vector<ull> v;

int Dfs(int Len, char s1[], char s2[])
{
    v.clear();
    int n=strlen(s1), m=strlen(s2);
    for(int i=0;i<=n-Len;i++)
    {
        v.push_back(getLR(i, i+Len-1));
    }
    sort(v.begin(), v.end());

    for(int i=0;i<=m-Len;i++)
    {
        ull key=getLR1(i, i+Len-1);
        if(binary_search(v.begin(), v.end(), key))
        {
            return 1;
        }
    }
    return 0;
}

int main()
{
    getp();
    scanf("%s%s",s1,s2);
    Hash(s1);
    Hash1(s2);
    int L=0, R=min(strlen(s1), strlen(s2)), k=0;
    while(L<=R)
    {
        int mid=(L+R)/2;
        if(Dfs(mid, s1, s2))
        {
            L=mid+1, k=mid;
        }
        else
        {
            R=mid-1;
        }
    }
    printf("%d\n",k);

    return 0;
}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值