[POJ 2774] Long Long Message (字符串哈希+二分)

原创 2016年08月30日 19:32:51

链接

POJ 2774


题意

给出两个字符串,寻找其最长公共子串。
注意字符串的长度较大,100000。


思路

字符串哈希典型问题,寻找N个字符串的最长公共子串。对于N个长度不超过L的字符串,哈希可以在O(N*L*log(L))内解决此问题。本题N为2。
做法是对长度进行二分,对每个长度len,可以在线性时间内求出字符串s1中所有长度为len的哈希值,把这些哈希值存在哈希表中。同样对s2求出其长度为len的哈希值,对每个哈希值查找哈希表,如果哈希表中已存在该哈希值,则表示s1中含有相同子串。


代码

#include <cstdio>
#include <cstring>
#include <algorithm>
#include <iostream>
#include <cstdlib>
using namespace std;
typedef unsigned long long ulint;
//ulint seed = 100000007uLL;
ulint seed = 31uLL;
#define maxn 299999
char s1[maxn], s2[maxn];
int len1, len2;
int  bg[maxn], nx[maxn];
ulint H[maxn], xp[maxn];
bool check(int len)
{
    //printf("check len = %d\n", len);
    memset(bg, 0, sizeof(bg));

    ulint t = 1, ah = 0, bh = 0;
    int e = 0;
    for(int i = 0; i < len; i++)
    {
        t *= seed;
        ah = ah * seed + s1[i];
        bh = bh * seed + s2[i];
    }

    H[++e] = ah;
    nx[e] = bg[ah % maxn];
    bg[ah % maxn] = e;

    for(int i = len; i < len1; i++)
    {
        ah = ah * seed - s1[i-len] * t + s1[i];

        H[++e] = ah;
        nx[e] = bg[ah % maxn];
        bg[ah % maxn] = e;
    }

    for(int pos = bg[bh % maxn]; pos; pos = nx[pos])
    {
        if(H[pos] == bh) return true;
    }

    for(int i = len; i < len2; i++)
    {
        bh = bh * seed - s2[i-len] * t + s2[i];

        for(int pos = bg[bh % maxn]; pos; pos = nx[pos])
        {
            if(H[pos] == bh) return true;
        }
    }
    return false;
}

int main()
{
    //freopen("2774.txt", "r", stdin);

    scanf("%s%s", &s1, &s2);
    len1 = strlen(s1);
    len2 = strlen(s2);
    for(int i = 0; i < max(len1, len2); i++)
    {
        if(i < len1) s1[i] = s1[i] - 'a' + 1;
        if(i < len2) s2[i] = s2[i] - 'a' + 1;
    }

    int l = 1, r = min(len1, len2), m, res = 0;
    while(l <= r)
    {
        m = (l + r) >> 1;

        if(check(m))
        {
            //printf("ok\n");
            l = m + 1;
            res = max(res, m);
        }
        else r = m - 1;
    }

    cout << res << endl;

    return 0;
}
版权声明:想转就转吧,反正也是人人都会的东西:-(

poj 2774 Long Long Message 求两个字符串的最长公共子串 后缀数组

Long Long MessageTime Limit: 4000MS Memory Limit: 131072KTotal Submissions: 10949 Accepted: 4374Case...

poj-2774 二分+字符串哈希+二分

给两个最多100000长度的字符串,求出他们的最长公共子串。         最长公共子串存在单调性 -- 如果两个串存在长度为k的公共子串,那么必然存在长度0到k-1的公共子串。 利用其单调性,先二...
  • HTT_H
  • HTT_H
  • 2015年01月18日 20:43
  • 540

POJ 2774 Long Long Message(最长公共子串 -初学后缀数组)

后缀数组的两篇神论文: 国家集训队2004论文集 许智磊 算法合集之《后缀数组——处理字符串的有力工具》 很多人的模版都是用论文上的 包括kuangbin的模版:(DA算法) 模版中...

【POJ】【P2774】【Long Long Message】【题解】【hash】

传送门:http://poj.org/problem?id=2774

后缀数组(模板题) - 求最长公共子串 - poj 2774 Long Long Message

Language: Default Long Long Message Time Limit: 4000MS   Memory Limit: 131072K T...

【POJ2774】Long Long Message,第一次的后缀数组

像我这样的人不适合做acm

POJ2774 Long Long Message (后缀数组—最长公共子串)

题目题意:给定两个字符串 A 和 B ,求最长公共子串。A 的后缀和 B 的后缀的最长公共前缀的最大值。如果枚举A和 B 的所有的后缀,那么这样做显然效率低下。由于要计算 A 的后缀和 B 的后缀的最...
  • justljf
  • justljf
  • 2016年07月31日 22:53
  • 166

[POJ2774][后缀数组求LCP]Long Long Message

[Problem Description] The little cat is majoring in physics in the capital of Byterland. A piece of...

POJ 2774 Long Long Message (后缀数组)

题目类型 后缀数组 题目意思 问两个最长 1e5 的字符串的最长公共子串 解题方法 在第一个字符串后添加一个区别于输入的所有字符的字符(例如 '#') 后再...

POJ 2774 Long Long Message(后缀数组:倍增算法)

字符串的任何一个子串都是该字符串某个后缀的前缀。 两个字符串的最长公共子串可转化为,求两者后缀两两比较的最长公共前缀的最大值。 定义: 后缀数组(sa[]),名次数组(rank[]): 子串st...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:[POJ 2774] Long Long Message (字符串哈希+二分)
举报原因:
原因补充:

(最多只允许输入30个字)