题意:给出n个数字,数字很长,用字符串读入,长度总和为10^5。求这n个字符串的所有子串(不重复)的和取模2012 。
解题思路:后缀自动机。。因为要处理所有不同的子串,所以想到后缀自动机。将所有的串一个个建进去,用一个10去间隔开来。建好之后,我们要统计和了。后缀自动机有这样一个性质,从s出发,到达所有节点的路径的集合,即所有该串的不相同的子串的集合(这个性质为什么我就不详细解释了,想详细了解的可以找我详细讨论,我也加深下理解),还有另一个性质,父亲的代表串的长度比儿子短(显而易见,不解释了)。利用第一个性质,我们记录节点的sum[u]表示到u节点的所有子串的和,那么对于u下面一个能到达的节点v,sum[v] = sum[u] * 10 + cnt[u] * k (cnt[u] 表示到达u的路径数,因为任意一条路径都可以再添上一个k,所以用cnt[u] * k),cnt 的维护就是从父亲累加过来了。所有节点的sum求完之后,累加即答案。一开始我是用的广搜,从根开始,如果有儿子就往儿子更新。但是这样是不对的,有可能儿子的代表串的长度并不是len[u] +1啊,当你将儿子加入到更新队列中时,此时它的信息并不完整,因此我们根据第二个性质,给节点排序,父亲在前。这样的话,就可以保证你要用v向下更新时,它的信息已经是真实的了。
后缀自动机,不错的数据结构,代码简短,效率高:
#pragma comment(linker, "/STACK:1024000000,1024000000")
#include<stdio.h>
#include<string.h>
#include<algorithm>
#include<queue>
using namespace std ;
const int maxn = 111111 ;
int ans ;
int sum[maxn<<1] , cnt[maxn<<1] ;
int pos[maxn<<1] ;
int c[11][maxn<<1] , fa[maxn<<1] , val[maxn<<1] ;
int tot , last ;
bool cmp ( int i , int j ) {
return val[i] < val[j] ;
}
struct sam {
int new_node ( int step ) {
int i ;
val[++tot] = step ;
for ( i = 0 ; i < 11 ; i ++ ) c[i][tot] = 0 ;
fa[tot] = 0 ;
return tot ;
}
void add ( int k ) {
int p = last , i ;
int np = new_node ( val[p] + 1 ) ;
while ( p && !c[k][p] ) c[k][p] = np , p = fa[p] ;
if ( !p ) fa[np] = 1 ;
else {
int q = c[k][p] ;
if ( val[p] + 1 == val[q] ) fa[np] = q ;
else {
int nq = new_node ( val[p] + 1 ) ;
for ( i = 0 ; i < 11 ; i ++ ) c[i][nq] = c[i][q] ;
fa[nq] = fa[q] ;
fa[q] = fa[np] = nq ;
while ( p && c[k][p] == q ) c[k][p] = nq , p = fa[p] ;
}
}
last = np ;
}
void init () {
tot = 0 ;
last = new_node ( 0 ) ;
}
void solve () {
int i , j ;
for ( i = 1 ; i <= tot ; i ++ ) pos[i] = i ;
sort ( pos + 1 , pos + tot + 1 , cmp ) ;
for ( i = 1 ; i <= tot ; i ++ ) {
int u = pos[i] ;
// printf ( "dp[%d] = %d , cnt[%d] = %d\n" , u , sum[u] , u , cnt[u] ) ;
for ( j = 0 ; j < 10 ; j ++ ) {
if ( u == 1 && j == 0 ) continue ;
if ( !c[j][u] ) continue ;
int v = c[j][u] ;
int add = ( sum[u] * 10 + j * cnt[u] ) % 2012 ;
sum[v] = ( sum[v] + add ) % 2012 ;
cnt[v] += cnt[u] ;
// printf ( "dp[%d] = %d , cnt[%d] = %d\n" , v , sum[v] , v , cnt[v] ) ;
}
}
for ( i = 1 ; i <= tot ; i ++ ) ans = ( ans + sum[i] ) % 2012 ;
}
} suf ;
char s[maxn] ;
int main () {
int n , i ;
while ( scanf ( "%d" , &n ) != EOF ) {
suf.init () ;
ans = 0 ;
memset ( sum , 0 , sizeof ( sum ) ) ;
memset ( cnt , 0 , sizeof ( cnt ) ) ;
cnt[1] = 1 ;
while ( n -- ) {
scanf ( "%s" , s ) ;
int len = strlen ( s ) ;
for ( i = 0 ; i < len ; i ++ )
suf.add ( s[i] - '0' ) ;
suf.add ( 10 ) ;
}
suf.solve () ;
printf ( "%d\n" , ans ) ;
}
}
/*
4
62
0000
411
164
782
*/