在获取dotamax的直播数据时用到了正则表达式,在此记录一下。
String test="<ul><li style=\"300px\">a</li><li style=\"300px\">b</li><li style=\"300px\">c</li><li style=\"300px\">d</li></ul>";
Pattern pt=Pattern.compile("(<li style=.*?>)(.*?)(</li>)");
Matcher mat=pt.matcher(test);
while(mat.find()){
System.out.println(mat.group()); //输出完整的匹配
System.out.println(mat.group(1)); //输出第一个括号的匹配
System.out.println(mat.group(2)); //输出第二个括号的匹配
}
mat.find() 尝试去寻找对于输入的test字符串的下一个匹配pattern的子字符串。
mat.matches()尝试匹配完整的输入区域 上面匹配不了 需要在两边加上.*
输出<li style="300px">a</li>
<li style="300px">
a
<li style="300px">b</li>
<li style="300px">
b
<li style="300px">c</li>
<li style="300px">
c
<li style="300px">d</li>
<li style="300px">
d
每个括号分为一组, .*是最长匹配, .*?是最短匹配,+对应的是 +?,{m,}对应的是 {m,n}?