正则表达式可以做什么?
1.一句话,可以提取任何你想提取的字符,包括数字,字母,特殊符号,以及它们的排列组合。
正则表达式的常用类
1.Pattern
Pattern 类没有公共构造方法。要创建一个 Pattern 对象,你必须首先调用其公共静态编译方法,它返回一个 Pattern 对象。该方法接受一个正则表达式作为它的第一个参数。
2.Matcher
Matcher 对象是对输入字符串进行解释和匹配操作的引擎。与Pattern 类一样,Matcher 也没有公共构造方法。你需要调用 Pattern 对象的 matcher 方法来获得一个 Matcher 对象。
3.PatternSyntaxException
PatternSyntaxException 是一个非强制异常类,它表示一个正则表达式模式中的语法错误。
前两个类如何使用?
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class PatternTest {
public static void main(String[] args) {
String content="123";//要被匹配的文本
//1.创建模式
Pattern pattern= Pattern.compile("\\d\\d\\d");
//2.创建匹配器,进行匹配
Matcher matcher=pattern.matcher(content);
if(matcher.find()){
System.out.println("匹配成功");
}else{
System.out.println("匹配失败");
}
}
}
1.我们首先创建模式,例如\d\d\d就代表三个任意的[0-9]组合的数字
2.再创建匹配器,将事先准备好的文本content传进去
3.我这里content为123,满足要求,因而会输出"匹配成功"
元字符
1.限定符
符号 | 含义 | 示例 | 说明 | 匹配输入 |
---|---|---|---|---|
* | 指定字符重复0-n次 | (a)* | a可出现0-n次 | a, (此处为0个a) ,aa ,aaa,a…aa |
+ | 指定字符重复1-n次(至少一次) | a+(b)* | a后面有+,说明a至少出现一次,b后面有*同上 | a,ab,aab,aabb,a…ab…b |
? | 指定字符重复0-1次 | a+b? | a至少出现1次,b后面有?,故b出现0或1次 | ab,a,aab,aa,aa…ab,aa…a |
{n} | 只能输入n个字符 | [abcd]{3} | 表示从a,b,c,d中任选三个组成长度为3的字符串,与顺序无关 | abc,abd,dca,dbc… |
2.选择匹配符
符号 | 说明 | 示例 | 解释 |
---|---|---|---|
\ | 匹配其之前或者之后的表达式 | ab\cd | ab或者cd |
(注意上述“\”改为“|”)
3.分组组合和反向引用
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class PatternTest {
public static void main(String[] args) {
String content="1234";//要被匹配的文本
//1.创建模式
Pattern pattern1= Pattern.compile("\\d\\d\\d\\d");
Pattern pattern2=Pattern.compile("(\\d\\d)(\\d\\d)");
pattern1未分组,pattern2分组匹配
为什么需要分组匹配呢?
例如我要匹配1221,123321这种回文数,利用分组就会非常简单,不过需要反向引用,这里简单试=使用一下反向引用,以后会详细介绍,请看代码–>
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class PatternTest {
public static void main(String[] args) {
String content="1221";//要被匹配的文本
//1.创建模式
Pattern pattern=Pattern.compile("(\\d)(\\d)\\2\\1");
//2.创建匹配器,进行匹配
Matcher matcher=pattern.matcher(content);
if(matcher.find()){
System.out.println("匹配成功");
}else{
System.out.println("匹配失败");
}
}
}
4.字符匹配符
符号 | 说明 | 示例 | 解释 |
---|---|---|---|
[ ] | 可接收的字符列表 | [abcd] | a,b,c,d中任意一个字符 |
[^] | 不接收的字符列表 | [^abc] | 除a,b,c之外任意一个字符,包括数字和特殊符号 |
- | 连字符 | A-Z | 任意A-Z之间的字母 |
5.定位符
符号 | 含义 | 示例 | 说明 | 匹配输入 |
---|---|---|---|---|
^ | 指定起始字符 | ^ [0-9]+[a-z]* | 该字符串必须至少以一个数字开头,后接任意个小写字母的字符串 | 1,1a,12a,… |
$ | 指定结束字符 | ^ [0-9]+[a-z]+$ | 该字符串必须至少以一个数字开头,并以至少一个小写字母结尾 | 1a,11abc,… |
\\b | 匹配目标字符串的边界 | jay\\b | 边界指的是子串间有空格,或者目标字符串的结束位置 | asdfjay |
小总结
1.这期简单的写了一下最基本的正则表达式中出现的常用类
2.介绍构成正则表达式的元字符,想要学好正则表达式,每个元字符都要了解,并熟练使用
3.下期会带来更多正则表达式的书写及应用
PS:第一次写csdn,有什么写的不好的地方欢迎指正!!!