鉴于您对我的其他答案的答复,这应该适用于您指定的严格格式的情况:
String sample = "3A/45 Jindabyne Rd, Oakleigh, VIC 3166";
Pattern pattern = Pattern.compile("(([^/ ]+)/)?([^ ]+) ([^,]+), ([^,]+), ([^ ]+) (\\d+)");
Matcher m = pattern.matcher(sample);
if (m.find()) {
System.out.println("Unit: " + m.group(2));
System.out.println("Number: " + m.group(3));
System.out.println("Street: " + m.group(4));
System.out.println("Suburb: " + m.group(5));
System.out.println("State: " + m.group(6));
System.out.println("Postcode: " + m.group(7));
} else {
throw new IllegalArgumentException("WTF");
}
如果您删除了“ 3A /”(在这种情况下, m.group(2)为null),街道编号为“ 45A”或“ 45-47”(如果我们在道路上添加了空格,则此方法有效)( Jindabyne East Rd')或郊区('Oakleigh South')。
如果您对正则表达式不熟悉,只为进一步解释该正则表达式:
(([^/ ]+)/)? 等于([^/ ]+/)? -即“不包含正斜杠或空格,后跟斜杠的任何内容”。 问号使其成为可选项(因此可以省略整个子句),最终版本中的额外括号是创建一个较小的内部组(不带斜杠),以供以后提取。
([^ ]+)是“捕获不是空格的任何内容(后跟空格)”-这是街道编号。
([^,]+),是“捕获不是逗号的任何内容(后跟逗号和空格)”-这是街道名称。 只要不是逗号,街道名称中的任何内容都有效。
([^,]+),再次相同,在这种情况下要捕获郊区。
([^ ]+)捕获下一个非空格字符串(状态缩写),并跳过其后的空格。
(\\\\d+)通过捕获任意数量的数字(邮政编码)来结束
希望对您有所帮助。