《大话数据结构》----串-----String字符串匹配算法---BF

最新推荐文章于 2022-04-24 00:23:35 发布

键盘上的农民

最新推荐文章于 2022-04-24 00:23:35 发布

阅读量289

点赞数

分类专栏：数据结构文章标签：算法字符串

本文链接：https://blog.csdn.net/qq_16513911/article/details/107801652

版权

数据结构专栏收录该内容

13 篇文章 0 订阅

订阅专栏

串

串(String)是由零个或者多个字符组成的有序序列,又名叫字符串
空格串 :是只包含空格的串,注意它和空串的区别,空格串是有长度的,而且可以不止一个空格.
子串与主串,串中任意个数的连续字符组成的子序列称为该串的子串,相应地,包含子串的串称为主串
子串在主串的位置就是子串的第一个字符在主串中的序号

存储

数组和链表都能存
不过实际来看链表弊端很明显,一个字符对应一个节点,就会存在很大的空间浪费,若是存放多个字符,又考虑多少个问题,这都会影响串处理的效率,但是在连接串与串操作方便

总的来说:顺序存储灵活,性能比链表存储结构好

匹配BF算法

含义

BF (Brute Force) 的缩写,就是暴力算法,拆开字符一个个比较,通俗易懂,符合常理和第一反应,当然效率肯定慢啊,都暴力算法了.
截图君上场,简单介绍一下暴力算法,知道的可以直接忽略

暴力1
暴力2

时间复杂度

这个时间复杂度算起来也挺有意思的,故单独敲敲文字过一遍,主要查找的时候有特殊情况,会影响到时间复杂度的计算
设:主串为m,子串为n,

最好的情况:当然是一下就找到啊,字符串主串mabcdefg和子串nabc,查找的次数一轮就通过为3次,根据大O时间复杂度计算¹(<—不知道点这个1脚注),即为O(n)
稍微差点的情况: 例如代码的例子,O(主串+子串),即O(m+n),因为所有字符都要一个个匹配,在遍历m的基础上,再加上n
最坏的情况: 例如000000000001和001,这种情况,每个字符都要匹配3次,001三个长度,直到匹配第三个1的时候,才发现不是,所以时间复杂度是前面的匹配长度乘以后面的长度,这样一来时间复杂度O(n*(m-n+1)),一般实际使用时m >> n,所以可以认为趋近于O(m*n)

代码

package com.company;

/**
 * @Author: comfort
 * @Date: 2020/8/4
 */
public class StringTest {

    public static void main(String[] args) {
        String source = "abcdefghijklmn";
        String look = "jkl";
        System.out.println(BF(source, look));


    }
  
    /**
     * BF暴力检索
     * @param source  原字符串
     * @param lookupStr  要查找的字符串
     * @return  成功返回下标,否则-1
     */
    public static int BF(String source,String lookupStr){

		//初始化从0开始的下标
        int souIndex=0;
        int lookIndex=0;
        //转化char根据字符一一查找
        char[] sourceChar = source.toCharArray();
        char[] lookChar = lookupStr.toCharArray();

        //思路 :判断时,要已两个字符的下标长度为条件
        while (souIndex<sourceChar.length&&lookIndex<lookChar.length ){
            System.out.println(souIndex+" "+sourceChar[souIndex]+"  "+lookIndex+"  "+lookChar[lookIndex] );
            //两个字母相等
            if (sourceChar[souIndex] == lookChar[lookIndex]) {
                souIndex++;
                lookIndex++;
            }else{
                //找不到  回退
                //如果当前字符匹配不成功,则souIndex回溯到此次匹配最开始的位置+1处,也就是
                //souIndex = souIndex - lookIndex + 1
                souIndex=souIndex-lookIndex+1;
                lookIndex=0;
            }

        }
        if (lookIndex == lookChar.length) {
            return souIndex - lookIndex;
        }
        return -1;

    }
}

输出

当然,如果字符串不存在,一直会检索所有(13次)

比如我输入lmc时,主串一直从头运行到最后,最后返回-1

收获

第一次敲看着简单,撇到一边对着屏幕自己敲真有点费劲,敲过一遍就好多了
while循环条件和初始化index比较重要,书中写的是从1开始,故重置算法是i=i-j+2,看的我云里雾里,自己翻了资料,发现初始化index从0开始比较符合思路.
重置步骤i=i-j+1这行代码比较直接给出来了,其实自己找个纸画画,目的就是j=0时,让i变回上一次开始的位置,多举两三个例子,就发现了i和j之间的关系.
最后的返回下标,两个数字相减是可以倒推出来,也是看资料太直接了.最好动动脑.