字符串搜索,java版本的 BM 算法 (Boyer-Moore)实现
无意中看到软大神的一篇字符串搜索算法描述,自己用java手动实现了一番,对于原始字符串为纯字母的搜索效率,String.indexOf 还是牛逼,而对于携带特殊字符和中英混合搜索,实现的BM 算法和jdk indexOf效率对比了一下,个人拙见,仅供参考!以下是run的结果打印
39232
39232
StopWatch '': running time = 5787100 ns
---------------------------------------------
ns % Task name
---------------------------------------------
003758100 065% my
002029000 035% java
source 字符长度:39304
直接上代码
- 按照算法描述,预处理带搜索的字符,代码尽量避免使用String类提供的方法,便于比较准确的测试
private static Map<String, Integer> initGoodSuffix(String src) {
Map<String, Integer> result = new HashMap<>(src.length() - 1);
int length = src.length();
for (int j = 1; j < length; j++) {
String tmp = sub(src, j, length);
String midd = sub(src, 0, j);
if (midd.length() < tmp.length()