字符串匹配
我们应该都使用过String.indexOf("xxx")方法来查找某个字符或字符串在String中的位置,这就是一个字符串的匹配问题。字符串匹配在很多场景中都有应用,下面介绍的几种算法,就是在不同场景下的解决方法。
字符串的存储
数据存储只有顺序或链式两种方式,首先字符串并不适合使用链式存储,因为字符串是由字符组成的,如果每个结点仅存储一个字符,会浪费大量的空间,而如果每个结点存储多个字符,那这个数量的选择就十分关键,不同的情况下可能需要不同的数量,这样一来变数太大,不够灵活。
而使用顺序存储的话,就不会有以上问题,但数组也有一定的缺陷,数组是定长的,有可能字符串比数组小,也可能数组放不下字符串,比如最初短信只能发70个汉字,超过的部分就会被丢弃,后来则是自动拆分成两条短信。所以存储字符串使用的数组一般会通过动态分配来处理。
“暴力”匹配算法
我们要做的,就是从一个字符串中,寻找到目标子串出现的位置,比如在“helloworld”中找到“low”出现的位置。“暴力”匹配算法就是我们最容易想到的方案,那就是用目标子串和该字符串的每一位一一对比,第一个字符一致再比第二个,直到找到为止。这里我们以char数组来模拟String,找到第一个匹配目标即可。示例代码如下:
private int indexOf(char[] origin, char[] target){ int originLen = origin.length; int targetLen = target.length; if(originLen==0 || targetLen == 0 || originLentargetLen-1) return i-targetLen; else return -1;}
我们算下“暴力”匹配算法的时间复杂度,假设n是原字符串长度,m是目标字符串长度,最好的情况是上来就匹配,也就是只走if语句,需要运行m次,所以复杂度为O(1)。最坏的情况是,每次都先走if语句,到最后一位判断时发现不匹配,然后else-if交替进行,时间复杂度为O((n-m+1)*m),这就好比是从字符串`aaaaaaaaaab`中查找`ab`ÿ