由于问题中给定字符串长度过大,所以一般的动态规划会超时
https://blog.csdn.net/u013008291/article/details/48106075
该博客中给出的一种基于后缀数组的思路可以解决该问题
另一种同样基于后缀数组的思路分析:
如果采用最原始的做法,一般会涉及到三层循环,第一,二层用于遍历所有的首字母,第三层用于检测公共长度,如果数据没有任何预处理,显然这样的三层循环是不可避免的,这里我们可以把第三层循环:
A B C D E F G
A O E F E F G
(表示正在从第一个串的E和第二个串的E开始往后匹配)
等价为另一种形式
CMP(“EFG”,“EFG”);
即比较这两个字符串后缀的公共长度
那么在这种思想下,本问题就可以等价为:从字串A的所有后缀和字串B的所有后缀中,找到一对前缀公共长度最大的
很直观的,我们会发现其中有很多后缀间的尝试性比较是无意义的,因为它们之间的"差距"太大了,这里我们可以借助另一种问题来思考,比如说有两个数组arr1和arr2,想从中找到相等的一对数,二重循环的确是一种办法,但是我们明显知道这其中有过多没意义的操作,我们应该只需要对那些相对较近的进行尝试就可以得到结果,一种方法就是对两个数组进行排序,这样的话只需要进行一次O(n+m)的扫描就可以得到结果,大致扫描思路如下
1—2
3 4
5 5
7 8
9 10
1 / 2
3 / 4
5 5
7 8
9 10
1 2
3—4
5 5
7 8
9 10
1 2
3 / 4
5/ 5
7 8
9 10
1 2
3 4
5—5 matched
7 8
9 10
而字串本身也是可以进行排序的,所以就可以进行和上面相同的处理(后缀数组的排序细节略),来减少多余的比较操作(后续的扫描方式略)