1.子串
定义:
子串指的是串中任意个连续的字符组成的子序列,称为该串的子串
举例:
假设字符串的长度为n,其非空子串的数目为你n(n+1)/2个。例如字符串“abc“的连续子串有 a,ab,abc,b,bc,c
代码:(实现求s字符串的所有不重复子串)
思路:进行二次循环,依次对子串进行后尾追加,第一次循环是为第一个字符选择进行移位,第二次循环是对子串进行后尾追加。
//s为待求字符串,res集合为子串集合
void gets(string s, set<string> &res) {
for (int i = 0; i < s.size(); i++) {
for (int j = 1; j <= s.size() - i; j++) {
res.insert(s.substr(i, j));
}
}
}
//输出:
for (auto a : strs) {
cout<<a<<endl;
}
2.子序列
定义:
所谓的子序列就是在原来序列中找出一部分组成的序列
举例:
12356710它的子序列有很多。比如:12,13 ,15,16,1356,137,…
代码:(判断字符串s是否为字符串t的子序列)
思路:二个指针从头开始计较,s[i] == t[j]字符相等了s字符串开始移位,不相等t字符串开始移位,直到其中一个字符串读完。判读s字符串是否读完,读完表示t中存在和s字符串相等的子序列
bool pand(string s, string t) {
int n = s.length(), m = t.length();
int i = 0, j = 0;
while (i < n && j < m) {
if (s[i] == t[j]) {
i++;
}
j++;
}
return i == n;
}
3.相关例题
阿里面试题:
字符串相似度:输入n,m分别表示字符串s,t的长度,相似度定义为:即为S的子串又为T的子序列的不同字符串数量(位置不同也算不同)
示例:
输入:
2 4
ac
abca
输出:
3
说明:“a”,“c”,“ac”均是s的子串,也均t的子序列。
解题思路:
先求出s字符串的子串,对于子串要进行剪枝:
1.重复的子串要进行set去重
2.大于字符串t长度的子串全部丢弃
3.前缀不是字符串t的子序列的子串全部丢弃
然后将符合条件的子串判断是否为字符串t的子序列,计算其数量
解题代码:
#include<bits/stdc++.h>
using namespace std;
int n, m;
//得到s的子串(不重复至res集合)
long long znum = 0;
string s, t;
bool pand(string s, string t);
void gets(string s, set<string> &res) {
string temp;
for (int i = 0; i < s.size(); i++) {
for (int j = 1; j <= s.size() - i&&j<=m; j++) { //子串长度不能大于t的长度
temp = s.substr(i, j);
if (res.find(temp) == res.end()&& pand(temp, t)) { //条件一:相同的子串不重复计算 条件二:如果公共前缀不是子序列后面的全丢弃
znum++;
res.insert(temp);
}else {
break;
}
}
}
}
//判断s是否为t的子序列
bool pand(string s, string t) {
int n = s.length(), m = t.length();
int i = 0, j = 0;
while (i < n && j < m) {
if (s[i] == t[j]) {
i++;
}
j++;
}
return i == n;
}
int main()
{
cin >> n >> m;
cin >> s;
cin >> t;
set<string> strs; //s的全部子串
gets(s, strs);
cout << znum;
return 0;
}