题目:给定一个文本文件,查找其中最长的重复子字符串。例如给出banana,那么最长子字符串为ana。
解法:用后缀数组这种数据结构来完成:
后缀数组a[5]来表示,其中
a[0] = banana
a[1] = anana
a[2] = nana
a[3] = ana
a[4] = na
a[5] = a
然后进行字典排序;
a[5] = a
a[3] = ana
a[1] = anana
a[0] = banana
a[4] = na
a[2] = nana
如此以来,只需要比较相邻的元素即可,看前一个元素是否是后一个元素的前几位。
例如,ana是anana的前三位,则ana为一个重复子字符串,最后只要找出最长的子字符串即可。
由于用到了排序,所以时间复杂度为O(nlogn)