原题链接:P2353 背单词
题目背景
小明对英语一窍不通,令老师十分头疼。于是期末考试前夕,小明被逼着开始背单词……
题目描述
老师给了小明一篇长度为 n n n 的英语文章,然后让小明背 m m m 个单词。为了确保小明不会在背单词时睡着,老师会向他提 Q Q Q 个问题,每次老师随机选择一个区间 [ l , r ] [l,r] [l,r],小明要回答在这段文字中他背过的单词总共出现过多少次。
输入格式
第一行两个整数 m , Q m,Q m,Q 如前所述。第二行为英语文章。接下来 m m m 行每行一个需要背的单词。接下来 Q Q Q 行每行一个询问,包含两个整数 l , r l,r l,r(含端点),即给定的文字区间。
输出格式
Q Q Q 行,对每个询问输出一行表示答案。
样例 #1
样例输入 #1
3 3
abcabcbc
abc
bc
a
1 3
6 7
1 8
样例输出 #1
3
0
7
提示
数据范围:
对于 30 % 30\% 30% 的数据, 1 ≤ n ≤ 1 0 3 , 1 ≤ Q ≤ 1 0 3 1\le n\le 10^3,1\le Q\le 10^3 1≤n≤103,1≤Q≤103
对于 60 % 60\% 60% 的数据, 1 ≤ n ≤ 1 0 5 , 1 ≤ Q ≤ 1 0 5 1\le n\le 10^5,1\le Q\le 10^5 1≤n≤105,1≤Q≤105
对于 100 % 100\% 100% 的数据, 1 ≤ n ≤ 1 0 6 , 1 ≤ m ≤ 10 , 1 ≤ Q ≤ 1 0 6 , 1 ≤ 1\le n\le 10^6,1\le m\le 10,1\le Q\le 10^6,1\le 1≤n≤106,1≤m≤10,1≤Q≤106,1≤每个单词的长度 ≤ N , 1 ≤ l ≤ r ≤ n \le N,1\le l\le r\le n ≤N,1≤l≤r≤n
提示:数据较大,请大家尽量采取高效率的读入输出方法。
知识点
KMP 字符串匹配,前缀和。
思路
观察数据范围,我们发现 Q ≤ 1 0 6 , m ≤ 10 Q \leq 10^6, m \leq 10 Q≤106,m≤10。
于是考虑枚举每个小明背过的单词 p p p,跑 KMP 后开一个数组 f i , j f_{i,j} fi,j 记录原字符串 s s s 中模式串 p i p_i pi 完全匹配且匹配位置 左端点 在 s s s 前缀 [ 1 , j ] [1,j] [1,j] 中的 p i p_i pi 的个数。
不过接下来我们发现它不满足区间减法,也就是不能通过 f i , r − f i , l − 1 f_{i,r}-f_{i,l-1} fi,r−fi,l−1 直接求出。
这是因为尽管 p i p_i pi 左端点在区间 [ l , r ] [l,r] [l,r] 中,但不能保证右端点也在此区间中。
所以查询区间 [ l , r ] [l,r] [l,r] 的时候我们选择区间 [ l , r − ∣ p i ∣ + 1 ] [l,r-|p_i|+1] [l,r−∣pi∣+1] 以保证这个字符串完整地在区间 [ l , r ] [l,r] [l,r] 中。
预处理时间复杂度 O ( M ∑ i = 1 M ∣ p i ∣ ) O(M\sum_{i=1}^{M}|p_i|) O(M∑i=1M∣pi∣),查询时间复杂度 O ( 1 ) O(1) O(1),可以接受。
代码
#include <iostream>
#include <cstring>
using namespace std;
const int N = 1000010;
int M, Q;
char p[N], s[N];
int ne[N], cnt[N];
int f[11][N];
inline void get_next(char *p)
{
int n = strlen(p + 1);
memset(ne, 0, sizeof ne); // 多测需要清空
for (int i = 2, j = 0; i <= n; i ++ )
{
while (j && p[i] != p[j + 1]) j = ne[j];
if (p[i] == p[j + 1]) j ++ ;
ne[i] = j;
}
}
inline void kmp(int id, char *s, char *p)
{
int n = strlen(p + 1), m = strlen(s + 1);
for (int i = 1, j = 0; i <= m; i ++ )
{
while (j && s[i] != p[j + 1]) j = ne[j];
if (s[i] == p[j + 1]) j ++ ;
if (j == n) f[id][i - j + 1] ++ ; // 如果完全匹配则在左端点为 i - j + 1 的位置 + 1
}
}
int main()
{
scanf("%d%d", &M, &Q);
scanf("%s", s + 1);
int m = strlen(s + 1);
for (int i = 1; i <= M; i ++ )
{
scanf("%s", p + 1); // 读入每个模式串 p
get_next(p); // 处理 p 的 next 数组
kmp(i, s, p); // KMP 并处理 f 数组
cnt[i] = strlen(p + 1); // cnt 记录 p 的长度
for (int j = 1; j <= m; j ++ )
f[i][j] += f[i][j - 1]; // 前缀和
}
int l, r;
while (Q -- )
{
scanf("%d%d", &l, &r);
int res = 0;
for (int i = 1; i <= M; i ++ )
if (r - cnt[i] + 1 > l - 1) // 当且仅当左端点最晚出现位置在 l - 1 之后才计入答案
res += f[i][r - cnt[i] + 1] - f[i][l - 1];
printf("%d\n", res);
}
return 0;
}