8月11日总结

本文详细介绍了正则表达式的基本语法,包括普通字符、转义字符、预定义字符和方括号表达式。同时讲解了边界匹配符及其作用,以及贪婪模式和勉强模式的匹配规则。此外,还阐述了在Java中如何使用Pattern和Matcher进行正则表达式的匹配操作。
摘要由CSDN通过智能技术生成

正则表达式(regular Expression)

语法

  1. 普通字符:字母、数字、汉字、下划线、以及没有特殊定义的标点符号
  2. 转义字符

预定义字符

预定义字符说明
.可以匹配除"\n"的所有字符
\d匹配0~9的所有数字
\s匹配所有的空白字符,包括空格、制表符、回车符等
\w匹配所有的单词字符,包括0~9所有数字、26个英文字母和下划线

注意:d、s、w的大写形式恰好匹配与之相反的字符

方括号表达式

方括号表达式说明
表示枚举例如[ab],表示a、b其中任意一个字符
表示范围:-例如[a-f],表示a~f范围内的任意字符
表示求否:^例如[^ab],表示非a、b的任意字符

注意:

  1. 正则表达式的特殊符号被包含到中括号中,则失去特殊意义,除了^、-之外
  2. 标准字符集合,除小数点外,如果被包含于中括号,自定义字符集合将包含该集合,例[\d.\-+]将匹配数字、小数点、+、-

边界匹配符

匹配的不是字符而是位置,符合某种条件的位置,所以又叫“零宽”匹配

边界匹配符说明
^行的开头
$行的结尾
\b单词的边界(\b前面的字符和后面的字符不全为\w)
\B非单词的边界
\A输入的开头
\Z输入的结尾,仅用于最后的结束符

两种匹配模式

  1. 贪婪模式:数量表示符默认采用贪婪模式,除非另有表达式。贪婪模式的表达式会一直匹配下去,直到无法匹配为止
  2. 勉强模式(最小匹配模式):用问号后缀(?)表示,只会匹配最少的字符

数量表示符

数量表示符说明
?表达式出现零次或一次
*表达式出现零次或多次
+表达式出现一次或多次
{n}表达式出现n次
{n,}表达式最少出现n次
{n,m}表达式最少出现n次,最多出现m次

使用正则表达式

使用位于java.util.regex的Pattern类和Matcher类
Pattern对象是正则表达式编译后在内存中的表示形式,因此,正则表达式字符串必须先被编译为Pattern对象,然后再利用该Pattern对象创建对应的Matcher对象。执行匹配所涉及的状态保留在Matcher对象中,多个Matcher对象可以共享一个Pattern对象

//将一个字符串编译成Pattern对象
Pattern p=Pattern.compile("/*正则表达式*/")
//使用Pattern对象创建Matcher对象
Matcher m=p.matcher("/*需要匹配的字符串*/")
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值