题目
思路
题目转化:将子串们两两匹配,使得 ∑ l c p \sum \rm lcp ∑lcp 最大。
不难发现,对于 A A A 的以 x x x 开头的子串,肯定要多多和 B B B 中以 x x x 开头的子串配对才好!
证明很简单。假如 A A A 中某个匹配的不是 B B B 中以 x x x 开头的, B B B 中也有一个,那么这两对的贡献都是 0 0 0 。交换匹配,至少会有 1 1 1 的贡献。
有了这个,可以直接用后缀数组排序,然后对于每种字符作为开头的子串,递归地处理。多出来的肯定就直接和不同字符开头的内部消化一下呀。
不难发现,如果每一步都有分叉,那么最多 O ( n ) \mathcal O(n) O(n) 步就会递归到头。求儿子对应管辖区间如果用二分查找,复杂度就是 O ( n log n ) \mathcal O(n\log n) O(nlogn) 的。问题在于,不分叉怎么办?不分叉,就说明当前区间内有一个 l c p \rm lcp lcp ,所以利用 h e i g h t height height 直接跳过 l c p \rm lcp lcp 就必然有分叉了。
复杂度 O ( n log n ) \mathcal O(n\log n) O(nlogn) 。
他山之石:将串翻转,用 S A M \tt SAM SAM ,后缀树上的 l c a lca lca 就是 l c p \rm lcp lcp 了,然后类似一个树形 d p \tt dp dp 。(其实就是上面的那个贪心啊,子树内尽力匹配。)