一直想学习正则表达式,奈何没有把心沉下去学过,导致一致不通,每次都是蒙对了,就不管他了。
最近又要用到正则了,我把网上的知识总结一下。最好大家自己搜一下,在3w网站自己认真学一下效果会更好。
一、什么是正则表达式
【正则表达式使用单个字符串来描述、匹配一系列匹配某个句法规则的字符串。】
runoob.com上的一个小栗子可以帮助你快速知晓正则表达式的用法,我就是从这个小栗子入门的,在这里贴一下。
二、正则表达式语法
1、普通字符
reg: [ABC]
text:AEBRR
则可以匹配出
A
B
reg:[A-Z]
text:AEBRR
则可以匹配出
A
E
B
R
R
reg:[A-Za-z0-9_]
可以匹配所有字母数字和下划线。
当然以上都是一个一个匹配出来的,要想匹配出来一串还需要用到特殊字符
2、特殊字符
* 表示前面的字符(表达式)出现次数>=0次
+ 表示前面的字符(表达式)出现>=1次
?表示前面的字符(表达式)出现0次或者1次
^在[]里面表示非,在[]外面表示字符串的开始xxxx
\w 匹配字母、数字、下划线。等价于 [A-Za-z0-9_] 在java中使用方法为 \\w
若想在java中匹配*这个符号 使用 \\*
在java中那些特殊情况都用\\我目前掌握的知识是这样的。
()标记一个子表达式的开始和结束:
用法假如你的字符串是这样的Davidsfirstnameis${Li} ,你想匹配到${Li}然后取出Li那么可以用(),正则表达式(java)为 \\$\\{([A-Za-z]+)\\} 在菜鸟调试工具中是这个 \${([A-Za-z]+)}https://c.runoob.com/front-end/854 这样能匹配到${Li}再取Li可以用
Pattern pattern = Pattern.compile(regex);
Matcher matcher = pattern.matcher(bodyText);
while(matcher.find()){
//macherKey可以取到${Li}
String macherKey = matcher.group(0).toString();
//matchValue可以取到Li
/**
* group是针对括号()来说的,group(0)就是指的整个串,group(1) 指的是第一个括号里
* 的东西,group(2)指的第二个括号里的东西。
*/
String matchValue = matcher.group(1).trim();
}
三、涉及到的java方法
Matcher matcher = pattern.matcher(content);
java.util.regex 包主要包括以下三个类:
- Pattern 类:
pattern 对象是一个正则表达式的编译表示。Pattern 类没有公共构造方法。要创建一个 Pattern 对象,你必须首先调用其公共静态编译方法,它返回一个 Pattern 对象。该方法接受一个正则表达式作为它的第一个参数。
- Matcher 类:
Matcher 对象是对输入字符串进行解释和匹配操作的引擎。与Pattern 类一样,Matcher 也没有公共构造方法。你需要调用 Pattern 对象的 matcher 方法来获得一个 Matcher 对象。
- PatternSyntaxException:
PatternSyntaxException 是一个非强制异常类,它表示一个正则表达式模式中的语法错误。
Matcher matcher = pattern.matcher(content);这步完成后并没有匹配出字符串,matcher.find()挨个取出匹配的字符串,直至取完。
关于matcher.group的用法详细见这篇文章吧
https://www.cnblogs.com/DreamDrive/p/7594259.html
关于正则表达式也可以参考这篇文章!
https://www.cnblogs.com/xhj123/p/6032683.html