正则表达式详细介绍

单个表示:

-1 \d 数字

-2 \D 非数字

注:大小写就是取反的意思

-3 \w 任意一个字母或数字或下划线
-4 \s 空白符(换行、制表符、空格)

-5 . 任意字符(除了换行符)


自定义字符集合:

[]表示匹配[]内的任意一个字符,是一个或运算,比如[123],就表示是数字1或数字2或数字3

[^]表示非运算,比如[^123],表示除了数字123的任意字符,包括空白符

[1-9],匹配数字1-9之间的任意一个字符

[^1-9a-b],匹配数字1-9和字符a-b之外的任意一个字符

注:在[]中,除了^和-以外的所有字符,都失去了特殊含义,比如.就是.,不是指任意字符了,当然\n这种还是代表换行


量词:

-1 {n},这里的n是一个数字,{n}表示连续出现几次,比如\d{6},表示连续匹配了6个数字,这个只与{}前一个表达式有关,比如\d\d{6}不是匹配12个数字,是表示匹配7个数字;如果想要表示12个数字,只需要加个(),(\d\d){6}即可

-2 {m,n},m和n都是数字,表示[m,n],比如\d{3,6},匹配的是满足连续3个-连续6个的数字的字符串,这里的匹配默认是贪婪模式,即先看有没有6个的,有的话返回6个,以此类推,如果想要使用非贪婪模式,即优先匹配3个连续数字的字符串,只需要在{}后加个?,\d{3,6}?即可。

-3 {m,},m是数字,表示匹配满足至少连续m次,但是没有{,m}这样的写法

-4 ? 匹配次数时0次或者1次,相当于{0,1},a\d{0,1}b等同于a\d?b

-5 + 匹配次数至少1次

-6 * 匹配次数至少0次


字符边界:

注:字符边界都是零宽的,即不会匹配到符号,这里匹配的是一个位置,而非字符

-1 ^ 字符串开始的位置 ^a表示字母a开头的位置

-2 $ 字符串结尾的位置 a$表示字母a结束的位置

-3 \b 匹配一个单词的边界(左边右边不全是\w),换句话就是,出现非数字非字符非下划线的符号就可以匹配了

举个例子:

字符串:test 90test test123

test\b的匹配结果是:test 90test test123,对test123的test来说,右边出现了数字

\btest\b的匹配结果是:test 90test test123,因为90test的test,左边是数字,test123的右边是数字


选择符和分组:

-1 | 表示或,匹配满足左边和右边的字符串,如\d|[a-z],表示匹配数字或者小写字母

-2 ()表示捕获组,将一个表达式用()括起来,就可以将这个括号视作整体

-3 \ddd,这里的ddd是数字,\ddd表示反向引用第几个括号的内容,举个例子:

    [a-z]{2}表示连续2个小写字母,([a-z]{2})\1表示将([a-z]{2})匹配到的字符串再重复一次做匹配,比如([a-z]{2})匹配到ab,那么([a-z]{2})\1表示abab

    ([a-z]{2})([a-z])匹配到的内容是abc,那么([a-z]{2})([a-z])\2则是abcc,([a-z]{2})([a-z])\1\2则是abcabc, ([a-z]{2})([a-z])\2\1则是abccab

总的来说,\ddd就是表示第几个括号的位置,以左括号的位置为准,因为这里捕获组会保存到内存,在大文本处理的时候可能会占用比较大的内存

-4 (?:) 非捕获组,即不会保存到内存,但是和()的返回结果相同,但是不能与反向引用相结合,因为不保存结果


预搜索(零宽断言):

之所以所零宽,因为这部分匹配的都是位置

-1 (?=exp) 这里exp是表达式, 整体表示断言自身出现的位置的后面能匹配表达式exp,举个例子

    有如下字符串:eating fighting doing,表达式 [a-z]+(?=ing)匹配的结果是eat fight do,ing不计入匹配结果

-2 (?!=exp) 和上面相似后面不等于exp

-3 (?<=exp) 断言自身出现的位置的前面能匹配表达式exp


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
1. Java正则表达式是一种用于匹配、查找和替换文本中符合特定模式的字符串的技术。它支持广泛的模式匹配语法,可以用来处理各种文本处理任务,例如数据验证、搜索和替换、数据提取等。 2. Java正则表达式匹配规则由一系列特殊字符和语法组成,其中一些最常用的包括: - 字符类:用于匹配单个字符,可以使用字符范围、反义符等来定义。 - 重复符:用于匹配重复出现的字符或子表达式,例如 * 表示匹配零个或多个字符,+ 表示匹配一个或多个字符,?表示匹配零个或一个字符。 - 分组:用于将子表达式分组,以便在后面进行引用或重复匹配。 - 元字符:用于匹配特殊字符,例如 \d 匹配数字字符,\w 匹配字母、数字或下划线字符,\s 匹配空白字符等。 3. Java提供了一系列正则匹配函数和工具类,其中最常用的是 java.util.regex.Pattern 和 java.util.regex.Matcher。这些类可以用于编译正则表达式、执行匹配操作、获取匹配结果等。 例如,可以使用 Pattern.compile() 方法编译一个正则表达式,然后使用 Matcher.matches() 方法对给定的字符串执行匹配操作: ```java String regex = "foo.*"; String input = "foobarbaz"; Pattern pattern = Pattern.compile(regex); Matcher matcher = pattern.matcher(input); if (matcher.matches()) { System.out.println("Match found!"); } else { System.out.println("Match not found."); } ``` 在这个例子中,正则表达式 "foo.*" 匹配以 "foo" 开头的任意字符序列,因此与字符串 "foobarbaz" 匹配成功,输出 "Match found!"。 除了 matches() 方法外,还有其他一些常用的正则匹配函数,例如 find()、replace()、replaceAll() 等,可以根据具体需求进行选择和使用。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值