您的示例输入是“lastname,firstname middlename” – 有了这个,您可以使用以下regexp来提取lastname,firstname和middlename(另外可能有多个空格,并且可能有资本和非资本)字符串中的字母 – 所有部分都是强制性的):
String input = "Lastname, firstname middlename";
String regexp = "([A-Za-z]+),\\s+([A-Za-z]+)\\s+([A-Za-z]+)";
Pattern pattern = Pattern.compile(regexp);
Matcher matcher = pattern.matcher(input);
matcher.find();
System.out.println("Lastname : " + matcher.group(1));
System.out.println("Firstname : " + matcher.group(2));
System.out.println("Middlename: " + matcher.group(3));
简短的摘要:
([A-Za-z]+) First capture group - matches one or more letters to extract the last name
,\\s+ Capture group is followed by a comma and one or more spaces
([A-Za-z]+) Second capture group - matches one or more letters to extract the first name
\\s+ Capture group is followed by one or more spaces
([A-Za-z]+) Third capture group - matches one or more letters to extract the middle name
仅当您的名字仅包含拉丁字母时才有效 – 可能您应该为字符使用更开放的匹配:
String input = "Müller, firstname middlename";
String regexp = "(.+),\\s+(.+)\\s+(.+)";
这匹配lastname,firstname和middlename的任何字符.
如果空格是可选的(只有第一次出现可以是可选的,否则我们无法区分出firstname和middlename),那么使用*而不是:
String input = "Müller,firstname middlename";
String regexp = "(.+),\\s*(.+)\\s+(.+)";
正如@Elliott所提到的,可能还有其他可能性,例如将String.split()或String.indexOf()与String.substring()一起使用 – 正则表达式通常更灵活,但更难维护,尤其是对于复杂表达式.
在任何一种情况下,使用尽可能多的不同输入(包括无效输入)实现单元测试,以便在修改后验证算法是否仍然有效.