数据结构基础笔记(7)字符串

字符串:如何正确回答面试中高频考察的字符串匹配算法?
1。字符串是什么?
一些特殊的字符串:
空串,指含有零个字符的串。例如,s = “”,书面中也可以直接用表示
空格穿,只包含空格的串。空格串中包含的是空格,且空格串中也可以包含多个空格
例如,s =" “,就是包含了3个空格的字符串
子串,串中任意连续字符组成的字符串叫做该串的子串
原串通常也称为主串。例如:a = “BEI”,b = “BEIJING”,c = “BJINGEI”
对于字符串a和b,由于b中含有字符串a,所以可以称a是b的子串,b是a的主串
对于c和a,虽然c中也含有a的全部字符,但不是连续的"BEI”,所以c和a没有任何关系
只有两个串的串值完全相同,这两个串才相等
即使两个字符串包含的字符完全相等,也未必相等。
字符串的存储结构有顺序存储和链式存储两种
顺序存储结构,是用一组地址连续的存储单元来存储串中的字符序列,一般是用定长数组来实现
有些语言会在串值后面加一个不计入串长度的结束标记符,比如\0来表示串值的终结
链式存储结构,由于传结构的特殊性,如果简单的将每个链结点存储为一个字符,就会造成很大的空间浪费
在链式存储中,每个节点设置字符数量的多少与串的长度、可以占用的存储空间以及程序实现的功能相关
如果字符串包含的数据量很大,但是可用的存储空间有限
就需要提高空间利用率
如果需大量的插入或删除数据,如果每个节点包含的字符过多,操作字符就会变得很麻烦
2.字符串的基本操作
由于字符串针对的是字符集,所有元素都是字符
因此字符串的基本操作与线性表有很大差别
线性表更关注的是单个元素的操作,比如增删查一个元素
字符串中更多关注的是查找子串的位置、替换等操作
2.1.字符串的新增操作
涉及对插入字符串之后字符的挪移操作,所以时间复杂度是O(n)
2.2.字符串的删除操作
与插入类似,所以复杂度为O(n)
2.3.字符串的查找操作
例:字符串s =“goodgoogle”,判断字符串t = "google"在s中是否存在
注意:如果字符串t的每个字符都在s中出现过,这并不能证明字符串t在s中出现了
如何判断一个子串是否在字符串中出现过呢
子串查找(字符串匹配)
首先,我们来定义两个概念,主串和模式串。我们在字符串 A 中查找字符串 B,则 A 就是主串,B 就是模式串。我们把主串的长度记为 n,模式串长度记为 m。由于是在主串中查找模式串,因此,主串的长度肯定比模式串长,n>m。因此,字符串匹配算法的时间复杂度就是 n 和 m 的函数。
假设要从主串 s = “goodgoogle” 中找到 t = “google” 子串。根据我们的思考逻辑,则有:
首先,我们从主串 s 第 1 位开始,判断 s 的第 1 个字符是否与 t 的第 1 个字符相等。
如果不相等,则继续判断主串的第 2 个字符是否与 t 的第1 个字符相等。直到在 s 中找到与 t 第一个字符相等的字符时,然后开始判断它之后的字符是否仍然与 t 的后续字符相等。
如果持续相等直到 t 的最后一个字符,则匹配成功。
如果发现一个不等的字符,则重新回到前面的步骤中,查找 s 中是否有字符与 t 的第一个字符相等。

public void s1() {

    String s = "goodgoogle";

    String t = "google";

    int isfind = 0;

    for (int i = 0; i < s.length() - t.length() + 1; i++) {

        if (s.charAt(i) == t.charAt(0)) {

            int jc = 0;

            for (int j = 0; j < t.length(); j++) {

                if (s.charAt(i + j) != t.charAt(j)) {

                    break;

                }

                jc = j;

            }

            if (jc == t.length() - 1) {

                isfind = 1;

            }

        }

    }

    System.out.println(isfind);

}

3.例题
例1:查找出两个字符串的最大公共字串。假设有且仅有 1 个最大公共子串。比如,输入 a = “13452439”, b = “123456”。由于字符串 “345” 同时在 a 和 b 中出现,且是同时出现在 a 和 b 中的最长子串。因此输出 “345”。
假设字符串 a 的长度为 n,字符串 b 的长度为 m,可见时间复杂度是 n 和 m 的函数。
首先,你需要对于字符串 a 和 b 找到第一个共同出现的字符,这跟前面讲到的匹配算法在主串中查找第一个模式串字符一样。
然后,一旦找到了第一个匹配的字符之后,就可以同时在 a 和 b 中继续匹配它后续的字符是否相等。这样 a 和 b 中每个互相匹配的字串都会被访问一遍。全局还要维护一个最长子串及其长度的变量,就可以完成了。
从代码结构来看,第一步需要两层的循环去查找共同出现的字符,这就是 O(nm)。一旦找到了共同出现的字符之后,还需要再继续查找共同出现的字符串,这也就是又嵌套了一层循环。可见最终的时间复杂度是 O(nmm),即 O(nm²)。代码如下

public void s2() {

    String a = "123456";

    String b = "13452439";

    String maxSubStr = "";

    int max_len = 0;

    for (int i = 0; i < a.length(); i++) {

        for (int j = 0; j < b.length(); j++){

            if (a.charAt(i) == b.charAt(j)){

                for (int m=i, n=j; m<a.length()&&n<b.length(); m++,n++) {

                    if (a.charAt(m) != b.charAt(n)){

                    break;

                    }

                    if (max_len < m-i+1){

                        max_len = m-i+1;

                        maxSubStr = a.substring(i, m+1);

                    }

                }

            }

        }	

    }

    System.out.println(maxSubStr);

}```

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值