如果需要效率,那么可以考虑这样:
char[] chars = str.toCharArray();
// oP: '省' 的偏移, oC: '市' 的偏移, oR: "自治区" 的偏移
int oP = -1, oC = -1, oR = -1;
char ch;
for (int i = 0; i < chars.length; i++) {
ch = chars[i];
// 一般来说 '省' 的位置会比 '市' 早出现
if (ch == '省') {
oP = i;
} else if (ch == '市') {
oC = i;
// 找到 '市' 后就可以跳出循环了
break;
} else if (ch == '自'
&& i + 2 < chars.length
&& chars[i + 1] == '治'
&& chars[i + 2] == '区') {
// "自治区" 出现的几率挺小
oR = i + 2;
}
}
if (oC != -1) {
str = str.substring(oC + 1);
} else if (oP != -1) {
str = str.substring(oP + 1);
} else if (oR != -1) {
str = str.substring(oR + 1);
}
这样的话,只需要对字符串做一次遍历,然后对原字符串做一次截断 (String.substring 调用的是 native 方法,效率不低)。
最好的情况是找到 oP/oR、oC 后按 oC 截断;
少见的情况是只找到 oP/oR 后按找到的偏移截断;
最差的情况是遍历完整个字符串,但此时就不需要截断了。
格式固定是 **省**市****的话,直接 str = str.substring(str.indexOf("市") + 1) 就好了嘛
如果是可能有一部分那就:
int offset = -1;
if ((offset = str.indexOf("市")) != -1) {
str = str.substring(offset + 1);
} else if ((offset = str.indexOf("省")) != 1) {
str = str.substring(offset + 1);
}
一般来说不会有 **市**省**** 的写法吧,所以先判断有没有市,有就直接截断,没有再看看有没有省,有就截断。