kmp bm Sunday 方法说白了都要字符串比较,这一步都很费时间,有没有略去或者至少件事这减少这一步骤度呢。
考虑目标字符串 str1=“abcd”,我们把他加起来 sum1=‘a’+'b'+‘c’+'d';
str2="a1b2c3abc2abcd";我们也4个字符加起来,如果不相等后移一位再求和比较,如果相等,再用字符串比较,字符串不等再后移。
这不是脱裤子放屁吗。还多一步求和。呵呵,不忙。
第一步 sum2=a+1+b+2,
关键第二步,
sum2=sum2-a+c;是不是不用挨个求和了呢,呵呵。如果str1很长,可以节省很多时间哦。关键不用一个字一个字比较啊。
通过求和比较,可以快速筛选。
可不可以进一步提高。
考虑 sum1a=a+c sum1b=b+d;
sum2=a+b 如果 sum2==sum1a,比较字符串
如果 sum2==sum1b,前移一位比较字符串。
都不等 后移两位求和
sum2=sum2-a+c
提高一倍哦,哦,不是,实际上较低了一点筛选效率,但是还是有提高。
那是不是可以继续增大间隔呢。理论上是的,但是增加间隔会增加和值比较次数。
如果以 str1实际长度为间隔,就会退化到字符串比较,而且增加很多开销。
如果精通概率学,应该可以计算出一个比较好的间隔。
原创,给他取个名字 dwx方法,哈哈,名字简写
如果把字符通过crc或者其他方法映射到32位,用异或取代求和方法,可以进一步提高筛选效率