原文:http://blog.likeshow.net/article.asp?id=77
public int[] getSuffixArray(String str)
{
if (str == null)
return null;
// 初始化后缀数组
String[] suffix = new String[str.length()];
for (int i = 0; i < suffix.length; i++)
suffix[i] = str.substring(i);
// 对后缀数组排序
Arrays.sort(suffix);
// 求结果数组
int[] result = new int[str.length()];
for (int i = 0; i < suffix.length; i++)
{
result[i] = str.lastIndexOf(suffix[i]);
}
return result;
}
因为以前写过STC,理解上按照了经验主义,搞了半天发现我果然之前看的C代码没理解错误,白折腾我这么久,当然这也和很多论文把它和DOUBLE ARRAY折腾在一起 称之为suffix array 的原因有关 弄了半天不考虑效率构造后缀数组原来如此简单啊 鄙视国内那些写的论文误导了我几个月!!!!!!
其应用可考虑引入LCP,查找最长公共前缀,也考虑字符串处理上的应用,正在看个法国老写的后缀数组的索引库 貌似也坡有模有样了 还没看到效率如何 之后有结果再发上来