JAVA正则表达式

正则表达式

1.1 正则表达式的概念
正则表达式(英语:Regular Expression,在代码中常简写为regex)。
正则表达式是一个字符串,使用单个字符串来描述、用来定义匹配规则,匹配一系列符合某个句法规则的字符串。在开发中,正则表达式通常被用来检索、替换那些符合某个规则的文本。
1.2 字符串类中涉及正则表达式的常用方法

 public boolean matches(String regex) //判断字符串是否匹配给定的规则
举例:校验qq号码.
1:要求必须是5-15位数字
2:0不能开头
代码演示:
String qq = “604154942”;
String regex = “[1-9][0-9]{4,14}”;
booleanflag2 = qq.matches(regex);

举例:校验手机号码
1:要求为11位数字
2:第1位为1,第2位为3、4、5、7、8中的一个,后面9位为0到9之间的任意数字。
代码演示:
String phone = “18800022116”;
String regex = “1[34578][0-9]{9}”;
booleanflag = phone.matches(regex);

 public String[] split(String regex) //根据给定正则表达式的匹配规则,拆分此字符串
举例:分割出字符串中的的数字
代码演示:
String s = “18-22-40-65”;
String regex = “-”;
String[] result = s.split(regex);
代码演示:
String s = “18 22 40 65”;
String regex = “”;
String[] result = s.split(regex);

附录(这部分内容大家知道有就可以了):正则表达式的匹配规则
参照帮助文档,在Pattern类中有正则表达式的的规则定义,正则表达式中明确区分大小写字母。我们来学习语法规则。
正则表达式的语法规则:
字符:x
含义:代表的是字符x
例如:匹配规则为 “a”,那么需要匹配的字符串内容就是 ”a”

字符:\
含义:代表的是斜线字符’’
例如:匹配规则为"\" ,那么需要匹配的字符串内容就是 ”\”

字符:\t
含义:制表符
例如:匹配规则为"\t" ,那么对应的效果就是产生一个制表符的空间

字符:\n
含义:换行符
例如:匹配规则为"\n",那么对应的效果就是换行,光标在原有位置的下一行

字符:\r
含义:回车符
例如:匹配规则为"\r",那么对应的效果就是回车后的效果,光标来到下一行行首

字符类:[abc]
含义:代表的是字符a、b 或 c
例如:匹配规则为"[abc]",那么需要匹配的内容就是字符a,或者字符b,或字符c的一个

字符类:[^abc]
含义:代表的是除了 a、b 或 c以外的任何字符
例如:匹配规则为"[^abc]",那么需要匹配的内容就是不是字符a,或者不是字符b,或不是字符c的任意一个字符

字符类:[a-zA-Z]
含义:代表的是a 到 z 或 A 到 Z,两头的字母包括在内
例如:匹配规则为"[a-zA-Z]",那么需要匹配的是一个大写或者小写字母

字符类:[0-9]
含义:代表的是 0到9数字,两头的数字包括在内
例如:匹配规则为"[0-9]",那么需要匹配的是一个数字

字符类:[a-zA-Z_0-9]
含义:代表的字母或者数字或者下划线(即单词字符)
例如:匹配规则为" [a-zA-Z_0-9] ",那么需要匹配的是一个字母或者是一个数字或一个下滑线

预定义字符类:.
含义:代表的是任何字符
例如:匹配规则为" . “,那么需要匹配的是一个任意字符。如果,就想使用 . 的话,使用匹配规则”\."来实现

预定义字符类:\d
含义:代表的是 0到9数字,两头的数字包括在内,相当于[0-9]
例如:匹配规则为"\d ",那么需要匹配的是一个数字

预定义字符类:\w
含义:代表的字母或者数字或者下划线(即单词字符),相当于[a-zA-Z_0-9]
例如:匹配规则为"\w ",,那么需要匹配的是一个字母或者是一个数字或一个下滑线

边界匹配器:^
含义:代表的是行的开头
例如:匹配规则为1[0-9]$ ,那么需要匹配的内容从[abc]这个位置开始, 相当于左双引号

边界匹配器:$
含义:代表的是行的结尾
例如:匹配规则为2[0-9]$ ,那么需要匹配的内容以[0-9]这个结束, 相当于右双引号

边界匹配器:\b
含义:代表的是单词边界
例如:匹配规则为"\b[abc]\b",那么代表的是字母a或b或c的左右两边需要的是非单词字符([a-zA-Z_0-9])
String regex = “.\b[abc]\b.”;
String str = “abc a bbc”;
booleanflag = str.matches(regex);

数量词:X?
含义:代表的是X出现一次或一次也没有
例如:匹配规则为"a?",那么需要匹配的内容是一个字符a,或者一个a都没有

数量词:X*
含义:代表的是X出现零次或多次
例如:匹配规则为"a*",那么需要匹配的内容是多个字符a,或者一个a都没有

数量词:X+
含义:代表的是X出现一次或多次
例如:匹配规则为"a+",那么需要匹配的内容是多个字符a,或者一个a

数量词:X{n}
含义:代表的是X出现恰好 n 次
例如:匹配规则为"a{5}",那么需要匹配的内容是5个字符a

数量词:X{n,}
含义:代表的是X出现至少 n 次
例如:匹配规则为"a{5, }",那么需要匹配的内容是最少有5个字符a

数量词:X{n,m}
含义:代表的是X出现至少 n 次,但是不超过 m 次
例如:匹配规则为"a{5,8}",那么需要匹配的内容是有5个字符a 到 8个字符a之间

逻辑运算符:XY
含义:代表的是X后跟Y
例如:匹配规则为"ab",那么需要匹配的字符串内容就是 ”ab”

逻辑运算符:X|Y
含义:代表的是X 或 Y
例如:匹配规则为"a|b",那么需要匹配的字符串内容就是 ”a”或”b”

逻辑运算符:(X)
含义:代表的是()括号内的数据作为一组数据出现,(X)的方式称为正则表达式中的组
例如:匹配规则为"(hello)+",那么需要匹配的内容是组内数据要出现多次,如”hellohellohello”;或者组内数据出现一次,如”hello”。
 注意实现:
 在定义正则表达式的匹配规则字符串的里面,想再次使用组中的内容,可通过\1来进行使用
例如:正则表达式的匹配规则为"(a) == \1";
使用数据"a == a"进行匹配结果为true;使用数据"a == b"进行匹配结果为false。

正则表达式:其本身就是由字符串组成的,是表示符合一定字符串的规则,用Sting类型的
字符用mathes方法与其进行比较,返回类型为布尔类型,true或者false

正则表达式其实

单个字符:
[abc] 表示符合的为字符a,b,c
[abc]任何字符,除了a,b,c以外,表示除外的意思。
[a-zA-Z]表示的a到z或者A到Z,表示两者之间的并集(包括两头的字母在内)
[a-d[m-p]]表示a到d或者m到p,表示两着之间的并集
[a-z&&[def]]表示d或e或f,&&表示两者之间的交集
[a-z]&&[^bc]表示a到z,除了b和c,&&表示两者之间的交集

用法: //正则表达式用法
String regex="[^abc]";
System.out.println(“a”.matches(regex)); // false
System.out.println(“e”.matches(regex)); //true
System.out.println(“et”.matches(regex)); //false,只能用单个字符.matches

. 表示任何字符 …表示两个任意的字符
\d 数字:[0-9]
\D 非数字:[^0-9]
\s 空白字符:[ \t\n\x0B\f\r]
\S 非空白字符:[^\s]
\w 单词字符: [a-zA-Z_0-9]
\W 非单词字符:[^\W]
由于\表示转义,所以定义时应该写成
String regex="\d";
String regex="\D";
String regex="\s";
String regex="\S";
String regex="\w";
String regex="\W";

    String regex="[^abc]";
    String regex1="\\d";           //  数字:[0-9]
    String regex2="\\w";        // \w 单词字符: [a-zA-Z_0-9]
    System.out.println("a".matches(regex));  // false
    System.out.println("e".matches(regex));   //true
    System.out.println("et".matches(regex));  //false
    System.out.println("a".matches(regex1));   // false
    System.out.println("0".matches(regex1));   //true
    System.out.println("a".matches(regex2));      //true

数量词:
X? X一次或者一次也没有
X* X零次或多次 (多次是包括一次的)
X+ X一次或多次
X{n} X恰好n次
X{n,} X至少n次
X{n,m} X至少n次,但是不超过m次

举例:
String regex="[abc]*";
System.out.println("".matches(regex)); //true
System.out.println(“abc”.matches(regex)); //true
System.out.println(“a”.matches(regex)); //true

通过正则表达式切割字符串,就是用split方法,得到的是一个字符串数组

String s="好好.wrq.没有干系.eeq;

String[] arr=s.split("\."); 表示通过.把字符串里面的内容分开

for(int i=0;i<arr.length;i++){
System.out.println(arr[i]);

}

叠词的正则表达式:
“快快乐乐”String str="(.)\1(.)\2";
“死啦死啦”String str="(…)\1";

//正则表达式获取功能,
/* 获取一段字符串中符合规则的字符提取出来,例子:
把"我之前的手机号码为18716871594,咱现在的手机号码为18616871594,老婆的手机号码为13253561489"这一段字符串的
的手机号提取出来。*/
String s=“我之前的手机号码为18716871594,咱现在的手机号码为18616871594,老婆的手机号码为13253561489”;
String regex=“1[3578]\d{9}”;
Pattern p=Pattern.compile(regex);
Matcher m=p.matcher(s);
while (m.find())
System.out.println(m.group());


  1. abc ↩︎

  2. abc ↩︎

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值