从学java开始就没弄清楚过捕获组的用法,一般没有处理复杂字符串的时候也不会去用。之前一直理解错了捕获组的用法,一直以为捕获组是可以循环捕获的
我以为的写法是这样的 (组1(组2))* 即组1循环匹配字符串,其实压根不是这样。
正确的做法是 捕获组表达式只要匹配最小的一个单元即可 然后通过 循环调用find去一步步推进匹配
这里很详细
这里是我自己的编写正则时候的工具网络,不是很稳定,可以是git自己搭过个
贴一个将xml文本里面的字段存入map的正则表达式使用例子 这里的xml并没有多级结构,也没有多余的属性
Pattern p=Pattern.compile("<(?<node>[0-9A-Za-z_]{2,50}?)>(?<val>.*?)<[/](?:[0-9A-Z_a-z]{2,50})>");
Matcher matcher = p.matcher(xml);
while (matcher.find()) {
String key = matcher.group("node");
String val = matcher.group("val");
result.put(key.trim(), val.trim());
}
(?: 代表非捕获组 即也是组 但find时候忽略
(? 即对 此捕获组取名 为 node
?) 即非贪心的 最小匹配 如果正则没有详细匹配往大了写 如.* 那么最好加上