Rabin-Karp字符串编码
学习来源、参考讲解
这是一种将字符串转化为唯一对应数值的方法,举个栗子,对于字符串abc来说,该字符串中有三种字符,那么base(基数,作为进制)就选大于3的数(一般选质数),这里选base=5,那么字符串对应的十进制数就应该有(012)5=7,这样得到的数就是唯一的。
但是,当字符串太长时,可能会溢出,就需要取余。但是,一旦进行取余操作,就可能出现两个或多个数取余得到同样值的情况。这时,需要尽可能地取大的MOD(如10e7+7),并设置多个模数,就可以将碰撞概率降得很低。此外,这里的模数一般也使用质数。