最长公共串 题解
题目
题目描述
给定一颗 n n n 个点的树,每个点 i i i 上都有一个字符串 s i s_i si,求所有两点间简单路径 x , y ( x < y ) x,y(x < y) x,y(x<y) 的个数,满足 ∣ l c p ( s p 1 , s p 2 , … , s p t ) ∣ ≥ k |lcp(s_{p_1} , s_{p_2} , \dots , s_{p_t})| \geq k ∣lcp(sp1,sp2,…,spt)∣≥k ,其中 l c p lcp lcp 为最长公共前缀, p 1 , … , p t p_1,\dots,p_t p1,…,pt 为简单路径上所有经过的点
输入格式
第一行两个正整数 n , k n, k n,k
接下来的 n n n 行每行一个字符串,其中第 i i i 行的字符串是 s i s_i si,字符集为 0 0 0 到 9 9 9 的数字
接下来的 n-1n−1 行每行两个正整数 x , y x, y x,y ,代表一条树边
输出格式
输出一个正整数,代表答案
样例
输入
6 1
1
1
4
5
1
4
1 2
2 5
3 2
1 4
4 6
输出
3
提示
【样例解释】
满足条件的路径仅有 ( 1 , 2 ) , ( 1 , 5 ) , ( 2 , 5 ) (1,2),(1,5),(2,5) (1,2),(1,5),(2,5)
【数据范围】
subtask 编号 | n n n | ∑ s i \sum s_i ∑si | 特殊性质 | 分数 |
---|---|---|---|---|
1 | ≤ 638 \leq 638 ≤638 | ≤ 1 0 5 \leq 10^5 ≤105 | 无 | 10 10 10 |
2 | ≤ 2000 \leq 2000 ≤2000 | ≤ 1 0 5 \leq 10^5 ≤105 | 无 | 10 10 10 |
3 | ≤ 1 0 5 \leq 10^5 ≤105 | ≤ 3 × 1 0 6 ≤ 3 × 106 \leq 3\times 10^6≤3×106 ≤3×106≤3×106 | 无 | 20 20 20 |
4 | ≤ 1 0 5 \leq 10^5 ≤105 | ≤ 3 × 1 0 6 \leq 3\times 10^6 ≤3×106 | 保证树为链 | 20 20 20 |
5 | ≤ 1 0 6 \leq 10^6 ≤106 | ≤ 5 × 1 0 6 \leq 5\times 10^6 ≤5×106 | 任意两字符串公共前缀 < k < k <k | 10 10 10 |
6 | ≤ 1 0 6 \leq 10^6 ≤106 | ≤ 5 × 1 0 6 \leq 5\times 10^6 ≤5×106 | 无 | 30 30 30 |
思路
由于题目要求树上简单路径的元素的公共前缀长度至少为 k k k 的路径个数,所以可以只看每个字符串的前 k k k 位,如果某个字符串的长度小于 k k k 则直接排除,在计算时不算这个点
使用 vector
存边,vector[i]
里面存的是与点
i
i
i 相连的所有点。
计算有多少条路径满足条件时,使用 ```dfs``
`搜索,记录某个节点的父亲节点和这个节点的编号,并搜索该节点的所有儿子节点
然后推导计算某个节点有多少种方案,式子如下图:
最终把所有答案累计求和,输出
代码
#include<bits/stdc++.h>
using namespace std;
const long long P1 = 2147483647;
const long long P2 = 1437356741;
template<typename T> inline void read(T &x){
T a = (T)0, b = (T)1;
char ch = ' ';
while(ch != '-' && (ch < '0' || ch > '9')){
ch = getchar();
}
if(ch == '-'){
b = -1;
ch = getchar();
}
while(ch >= '0' && ch <= '9'){
a = ((T)a << 3) + ((T)a << 1) + (ch ^ '0');
ch = getchar();
}
x = a * b;
}
template<typename T> inline void write(T x, char c = '\0') {
if(x < (T)0){
putchar('-');
x = -x;
}
if(x > (T)9){
write(x / (T)10);
}
putchar(x % (T)10 + '0');
if(c != '\0'){
putchar(c);
}
}
const int NR = 1e6;
long long a[NR + 10];
char s[NR + 10];
long long Hash_s(int k){
long long ret1 = 0;
long long ret2 = 0;
for(int i = 1;i <= k;i++){
ret1 = (ret1 * 10949ll + 17ll * s[i]) % P1;
ret2 = (ret2 * 21911ll + 37ll * s[i]) % P2;
}
return ret1 << 30 | ret2;
}
vector<int> v[NR + 10];
long long sum = 0;
long long b[NR + 10];
void dfs(int x, int fa){
for(auto i : v[x]){
if(i != fa) dfs(i, x);
}
if(a[x] == 0) return ;
long long ret1 = 0, ret2 = 0;
for(auto i : v[x]) if(i != fa){
if(a[i] != a[x]){
continue;
}
ret1 += 1ll * b[i];
ret2 += 1ll * b[i] * b[i];
b[x] += b[i];
}
sum += ret1;
sum += (ret1 * ret1 - ret2) / 2;
}
int main(){
//freopen("exp_lcp.in", "r", stdin);
int n, k;
read(n);
read(k);
int cnt = 0;
for(int i = 1;i <= n;i++){
scanf("%s", s + 1);
if(strlen(s + 1) >= k) a[i] = Hash_s(k);
else cnt++;
}
if(cnt == n){
write(0, '\n');
return 0;
}
for(int i = 1;i < n;i++){
int l, r;
read(l);
read(r);
//if(a[l] != a[r]) continue;
v[l].emplace_back(r);
v[r].emplace_back(l);
}
for(int i = 1;i <= n;i++){
b[i] = 1;
}
dfs(1, -1);
write(sum, '\n');
return 0;
}