[POJ 2774] Long Long Message (字符串哈希+二分)

原创 2016年08月30日 19:32:51

链接

POJ 2774


题意

给出两个字符串,寻找其最长公共子串。
注意字符串的长度较大,100000。


思路

字符串哈希典型问题,寻找N个字符串的最长公共子串。对于N个长度不超过L的字符串,哈希可以在O(N*L*log(L))内解决此问题。本题N为2。
做法是对长度进行二分,对每个长度len,可以在线性时间内求出字符串s1中所有长度为len的哈希值,把这些哈希值存在哈希表中。同样对s2求出其长度为len的哈希值,对每个哈希值查找哈希表,如果哈希表中已存在该哈希值,则表示s1中含有相同子串。


代码

#include <cstdio>
#include <cstring>
#include <algorithm>
#include <iostream>
#include <cstdlib>
using namespace std;
typedef unsigned long long ulint;
//ulint seed = 100000007uLL;
ulint seed = 31uLL;
#define maxn 299999
char s1[maxn], s2[maxn];
int len1, len2;
int  bg[maxn], nx[maxn];
ulint H[maxn], xp[maxn];
bool check(int len)
{
    //printf("check len = %d\n", len);
    memset(bg, 0, sizeof(bg));

    ulint t = 1, ah = 0, bh = 0;
    int e = 0;
    for(int i = 0; i < len; i++)
    {
        t *= seed;
        ah = ah * seed + s1[i];
        bh = bh * seed + s2[i];
    }

    H[++e] = ah;
    nx[e] = bg[ah % maxn];
    bg[ah % maxn] = e;

    for(int i = len; i < len1; i++)
    {
        ah = ah * seed - s1[i-len] * t + s1[i];

        H[++e] = ah;
        nx[e] = bg[ah % maxn];
        bg[ah % maxn] = e;
    }

    for(int pos = bg[bh % maxn]; pos; pos = nx[pos])
    {
        if(H[pos] == bh) return true;
    }

    for(int i = len; i < len2; i++)
    {
        bh = bh * seed - s2[i-len] * t + s2[i];

        for(int pos = bg[bh % maxn]; pos; pos = nx[pos])
        {
            if(H[pos] == bh) return true;
        }
    }
    return false;
}

int main()
{
    //freopen("2774.txt", "r", stdin);

    scanf("%s%s", &s1, &s2);
    len1 = strlen(s1);
    len2 = strlen(s2);
    for(int i = 0; i < max(len1, len2); i++)
    {
        if(i < len1) s1[i] = s1[i] - 'a' + 1;
        if(i < len2) s2[i] = s2[i] - 'a' + 1;
    }

    int l = 1, r = min(len1, len2), m, res = 0;
    while(l <= r)
    {
        m = (l + r) >> 1;

        if(check(m))
        {
            //printf("ok\n");
            l = m + 1;
            res = max(res, m);
        }
        else r = m - 1;
    }

    cout << res << endl;

    return 0;
}
版权声明:想转就转吧,反正也是人人都会的东西:-( https://blog.csdn.net/zichenzhiguang/article/details/52372282

POJ2774:Long Long Message(后缀数组)

Description The little cat is majoring in physics in the capital of Byterland. A piece of sad news ...
  • libin56842
  • libin56842
  • 2015-05-28 20:23:36
  • 2720

POJ - 2774 Long Long Message

求两个字符串的最长公共子串
  • sinat_29278271
  • sinat_29278271
  • 2016-08-01 13:28:52
  • 115

POJ 2774 Long Long Message

后缀数组水题。。。 Long Long Message Time Limit: 4000MS   Memory Limit: 131072KB   64bit IO...
  • u012797220
  • u012797220
  • 2013-12-30 16:58:56
  • 902

poj 2774 Long Long Message

题目:http://poj.org/problem?id=2774 求两个字符串的最长公共子串
  • Zhuhuangjian
  • Zhuhuangjian
  • 2014-04-30 10:38:13
  • 516

POJ 2774 Long Long Message

Description The little cat is majoring in physics in the capital of Byterland. A piece of sad news ...
  • jtjy568805874
  • jtjy568805874
  • 2016-08-14 21:00:06
  • 276

POJ 2774 哈希+二分长度

思路:这题一看就知道是后缀数组做的了,好像以前做过,不过现在专攻哈希,所以就用哈希做了。 不过这题我真是要疯了!!! 刚开始写的就对了,然后二分while循环那忘了写等号了,然后一直WA,尼玛...
  • u011466175
  • u011466175
  • 2014-09-22 22:38:48
  • 999

POJ 2774 Long Long Message(后缀数组:公共子串)

POJ 2774 Long Long Message(后缀数组:公共子串) http://poj.org/problem?id=2774 题意:给你两个长字符串,要你输出这两个字符串的最长公共字串长度...
  • u013480600
  • u013480600
  • 2014-04-18 20:11:05
  • 1232

【POJ】2774 Long Long Message 后缀数组

传送门:【POJ】2774 Long Long Message 题目分析:后缀数组入门题。终于开始学后缀数组了。。。鸡排(基数排序)一开始不会导致学了好久。。。 这题是将两个串并到一个串上...
  • u013368721
  • u013368721
  • 2014-12-09 15:57:11
  • 642

POJ 2774 : Long Long Message (后缀数组)

原文: http://blog.sina.com.cn/s/blog_6635898a0102duef.html 题意:给定两个字符串 A 和 B ,求最长公共子串。 思路:后缀数...
  • chj90220
  • chj90220
  • 2013-06-09 14:50:35
  • 737

poj 2774 Long Long Message 后缀数组

点击打开链接题目链接 Long Long Message Time Limit: 4000MS   Memory Limit: 131072K Total Submissions: 2...
  • qq_16843991
  • qq_16843991
  • 2015-07-20 18:11:01
  • 323
收藏助手
不良信息举报
您举报文章:[POJ 2774] Long Long Message (字符串哈希+二分)
举报原因:
原因补充:

(最多只允许输入30个字)