7-29 删除字符串中的子串 (20 分)
输入2个字符串S1和S2,要求删除字符串S1中出现的所有子串S2,即结果字符串中不能包含S2。
输入格式:
输入在2行中分别给出不超过80个字符长度的、以回车结束的2个非空字符串,对应S1和S2。
输出格式:
在一行中输出删除字符串S1中出现的所有子串S2后的结果字符串。
输入样例:
Tomcat is a male ccatat
输出样例:
Tom is a male
思路分析:
这是一道非常基本的字符串匹配类型的问题。在高级编程语言中一般可搭配contains()、replace()或单独使用replaceAll()等方法十分简洁的完成。出于训练的目的,笔者并不打算做“调包侠”,而决定从底层设计匹配、删除等算法。主要涉及递归、循环等编程思想。
匹配过程:主要是借鉴清华大学严蔚敏老师《数据结构》中第四章 串、数组和广义表中KMP算法一节,值得注意的是,笔者所写的getNext()函数并未使用next修正值。
删除过程:运用递归方法,重复匹配、重复删除,直到最后KMP函数返回值为-1。
示例代码:
import java.util.Scanner;
public class demo27 {
/*
* 删除字符串中的子串
*
* KMP算法的典型应用
*/
public static void main(String[] args) {
Scanner sc = new Scanner(System.in);
char[] ts = sc.nextLine().toCharArray();
char[] ps = sc.nextLine().toCharArray();
int start = KMP(ts, ps);//获取起始角标
delete(ts, ps, start);//删除
}
private static void delete(char[] ts, char[] ps, int start) {
if (start != -1) {
StringBuilder sb = new StringBuilder();
for (int i = 0; i < ts.length; i++) { // 删除操作
if (i >= start && i < start + ps.length) {
continue;
} else {
sb.append(ts[i]);//追加字符串
}
}
// 进行新一轮的删除
start = KMP(sb.toString().toCharArray(), ps);
delete(sb.toString().toCharArray(), ps, start);
} else {
//此时start值为-1,已经得到最后结果
StringBuilder sb = new StringBuilder();
for (int i = 0; i < ts.length; i++) {
sb.append(ts[i]);
}
System.out.println(sb.toString());
}
}
public static int KMP(char[] ts, char[] ps) {
int[] next = getNext(ps);//获取模式串next值
int i = 0;
int j = 0;
while (i < ts.length && j < ps.length) {
if (j == -1 || ts[i] == ps[j]) {
i++;
j++;
} else {
j = next[j];//i指针不回溯,j指向next值
}
}
if (j == ps.length) {
return i - j; //返回模式串第一次出现的起始角标
} else {
return -1;//不包含模式串
}
}
private static int[] getNext(char[] ps) {
int[] next = new int[ps.length];
int j = 0;
int k = -1;
next[0] = -1;
if (ps.length > 1) { //必须保证模式串长度大于1
if (k == -1 || ps[j] == ps[k]) {
next[++j] = ++k;//把下一位的next值改为k+1
} else {
k = next[k];//与KMP匹配思想类似,直接跳到新位置
}
}
return next;
}
}