[POJ 2774] Long Long Message (字符串哈希+二分)

原创 2016年08月30日 19:32:51

链接

POJ 2774


题意

给出两个字符串,寻找其最长公共子串。
注意字符串的长度较大,100000。


思路

字符串哈希典型问题,寻找N个字符串的最长公共子串。对于N个长度不超过L的字符串,哈希可以在O(N*L*log(L))内解决此问题。本题N为2。
做法是对长度进行二分,对每个长度len,可以在线性时间内求出字符串s1中所有长度为len的哈希值,把这些哈希值存在哈希表中。同样对s2求出其长度为len的哈希值,对每个哈希值查找哈希表,如果哈希表中已存在该哈希值,则表示s1中含有相同子串。
感觉本题存储哈希值的方式很优雅(从别人的代码中学来的),建议大家学习一下。


代码

#include <cstdio>
#include <cstring>
#include <algorithm>
#include <iostream>
#include <cstdlib>
using namespace std;
typedef unsigned long long ulint;
//ulint seed = 100000007uLL;
ulint seed = 31uLL;
#define maxn 299999
char s1[maxn], s2[maxn];
int len1, len2;
int  bg[maxn], nx[maxn];
ulint H[maxn], xp[maxn];
bool check(int len)
{
    //printf("check len = %d\n", len);
    memset(bg, 0, sizeof(bg));

    ulint t = 1, ah = 0, bh = 0;
    int e = 0;
    for(int i = 0; i < len; i++)
    {
        t *= seed;
        ah = ah * seed + s1[i];
        bh = bh * seed + s2[i];
    }

    H[++e] = ah;
    nx[e] = bg[ah % maxn];
    bg[ah % maxn] = e;

    for(int i = len; i < len1; i++)
    {
        ah = ah * seed - s1[i-len] * t + s1[i];

        H[++e] = ah;
        nx[e] = bg[ah % maxn];
        bg[ah % maxn] = e;
    }

    for(int pos = bg[bh % maxn]; pos; pos = nx[pos])
    {
        if(H[pos] == bh) return true;
    }

    for(int i = len; i < len2; i++)
    {
        bh = bh * seed - s2[i-len] * t + s2[i];

        for(int pos = bg[bh % maxn]; pos; pos = nx[pos])
        {
            if(H[pos] == bh) return true;
        }
    }
    return false;
}

int main()
{
    //freopen("2774.txt", "r", stdin);

    scanf("%s%s", &s1, &s2);
    len1 = strlen(s1);
    len2 = strlen(s2);
    for(int i = 0; i < max(len1, len2); i++)
    {
        if(i < len1) s1[i] = s1[i] - 'a' + 1;
        if(i < len2) s2[i] = s2[i] - 'a' + 1;
    }

    int l = 1, r = min(len1, len2), m, res = 0;
    while(l <= r)
    {
        m = (l + r) >> 1;

        if(check(m))
        {
            //printf("ok\n");
            l = m + 1;
            res = max(res, m);
        }
        else r = m - 1;
    }

    cout << res << endl;

    return 0;
}
版权声明:想转就转吧,反正也是人人都会的东西:-(

相关文章推荐

poj 2774 Long Long Message 求两个字符串的最长公共子串 后缀数组

Long Long MessageTime Limit: 4000MS Memory Limit: 131072KTotal Submissions: 10949 Accepted: 4374Case...

POJ 2774 Long Long Message

Description The little cat is majoring in physics in the capital of Byterland. A piece of sad news ...

POJ 2774 Long Long Message 题解&代码

第二道后缀数组…其实感觉比上一道简单【23333 后缀数组的主要用法之一就是height[]…这道题就是把两个字符串用分隔符连接起来,求新字符串的height[],然后找到有效height的最大值即...

poj-2774 二分+字符串哈希+二分

给两个最多100000长度的字符串,求出他们的最长公共子串。         最长公共子串存在单调性 -- 如果两个串存在长度为k的公共子串,那么必然存在长度0到k-1的公共子串。 利用其单调性,先二...
  • HTT_H
  • HTT_H
  • 2015-01-18 20:43
  • 509

【POJ】【P2774】【Long Long Message】【题解】【hash】

传送门:http://poj.org/problem?id=2774

POJ 2774 Long Long Message

赤裸裸的模板题,刚开始忘记判断是否在同一字符串中了 #include #include #include using namespace std; typedef long long ll; #d...

[POJ2774][后缀数组求LCP]Long Long Message

[Problem Description] The little cat is majoring in physics in the capital of Byterland. A piece of...

POJ 2774 Long Long Message (后缀数组)

题目类型 后缀数组 题目意思 问两个最长 1e5 的字符串的最长公共子串 解题方法 在第一个字符串后添加一个区别于输入的所有字符的字符(例如 '#') 后再...

POJ 2774 Long Long Message

后缀数组

POJ 2774 Long Long Message

http://poj.org/problem?id=2774 题意:给定两个字符串 A 和 B ,求最长公共子串。 思路:后缀数组。(摘自罗穗骞的国家集训队论文)字符串的任何一个子串都是这...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:深度学习:神经网络中的前向传播和反向传播算法推导
举报原因:
原因补充:

(最多只允许输入30个字)