《后缀数组-许智磊》论文的学习笔记

仔细看过了《后缀数组-许智磊》论文

在实现其中的算法时,发现一处疏漏:
计算LCP的方法:
原文算法是这样描述的:
    若 Rank[i]=1,则h[i]=0。字符比较次数为0。
    若 i=1 或者h[i-1]≤1,则直接将Suffix(i)和Suffix(Rank[i]-1)从第一个字符开始依次比较直到有字符不相同,由此计算出h[i]。字符比较次数为h[i]+1,不超过h[i]-h[i-1]+2。
    否则,说明i>1,Rank[i]>1,h[i-1]>1,根据性质3,Suffix(i)和Suffix(Rank[i]-1)至少有前h[i-1]-1 个字符是相同的,于是字符比较可以从h[i-1]开始,直到某个字符不相同,由此计算出h[i]。字符比较次数为h[i]-h[i-1]+2。

这里的应该是:Suffix(Rank(i))和Suffix(Rank[i]-1)来比较。

改后算法描述为:
    若 Rank[i]=1,则h[i]=0。字符比较次数为0。
    若 i=1 或者h[i-1]≤1,则直接将Suffix(Rank(i))和Suffix(Rank[i]-1)从第一个字符开始依次比较直到有字符不相同,由此计算出h[i]。字符比较次数为h[i]+1,不超过h[i]-h[i-1]+2。
    否则,说明i>1,Rank[i]>1,h[i-1]>1,根据性质3,Suffix(Rank(i))和Suffix(Rank[i]-1)至少有前h[i-1]-1 个字符是相同的,于是字符比较可以从h[i-1]开始,直到某个字符不相同,由此计算出h[i]。字符比较次数为h[i]-h[i-1]+2。

 

自己实现了一个扩展版的SuffixArry,即以单词为单位进行匹配,而不是单个字符的形式

源码到此处下载(不要分,免费下):

http://download.csdn.net/source/2045119

 

 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值