正则表达式?: ?= ?! 的用法详解


正则表达式中使用的 ?:?=?! 是三种不同的正则表达式语法,它们分别代表非捕获组、正向前瞻断言和负向前瞻断言。

1. ?: 用法

(?:...) 是一种非捕获组(non-capturing group)的语法。它用于将一部分正则表达式括在一起,但不将该部分作为单独的捕获组。这意味着即使匹配了这部分表达式,也不会在结果中创建新的捕获组。

正则表达式中的捕获组(capture group)是使用圆括号 () 包围的一部分表达式。这些捕获组在匹配到的字符串中标记了特定的部分,并将其保存起来以供稍后使用。

如果还不清楚什么是捕获组,下面给一个例子就清楚了:

import re

pattern = r'a(.*)test'
text = 'This is a good test.'

match = re.search(pattern, text)
if match:
    print("Found word:", match.groups())
# 输出
# Found word: (' good ',)

在这个示例中,(.*) 是一个捕获组,用于将atest 中间的字符提取出来。

知道了捕获组,那么非捕获组也能猜出来了。有时你可能只想将表达式括在一起,但不想保存匹配结果。在这种情况下,可以使用非捕获组 (?: ...)

示例:

import re

pattern = r'(?:abc)def'
text = 'abcdef'

match = re.search(pattern, text)
if match:
    print("Match found")

在这个示例中,(?:abc) 是一个非捕获组,它将 abcdef 组合在一起进行匹配,但不会作为单独的捕获组。

2. ?= 用法

?= 是正向前瞻断言(positive lookahead assertion)。它用于匹配某个子表达式后的位置,但不包含匹配到的子表达式在最终的结果中。前瞻断言用来确保某一部分的匹配被后续某一部分的条件匹配。

示例:

import re

pattern = r'abc(?=def)'
text = '.x abcdef123'
text2 = '.x abc1def123'

match = re.search(pattern, text)
if match:
    print("Match found:", match.group())
# 输出
# Match found: abc

match = re.search(pattern, text2)
if not match:
    print("Match not found")
# 输出
# Match not found

在这个示例中,abc(?=def) 使用了正向前瞻断言。它将匹配 abc 后面跟着 def 的部分。在 abcdef 中,它匹配了 abc,因为 abc 后面是 def

3. ?! 用法

?! 是负向前瞻断言(negative lookahead assertion)。它用于确保某个子表达式不匹配之后的位置,而不包含匹配到的子表达式在最终的结果中。

用法示例:

import re

pattern = r'abc(?!def)'
text = 'abcxyz'
text2 = 'abcdef'

match = re.search(pattern, text)
if match:
    print("Match found:", match.group())
# 输出
# Match found: abc

match = re.search(pattern, text2)
if not match:
    print("Match not found")
# 输出
# Match not found

在这个示例中,abc(?!def) 使用了负向前瞻断言。它将匹配 abc 后面不跟着 def 的部分。在 abcxyz 中,它匹配了 abc,因为 abc 后面没有 def

4. 总结

  • (?:...) 是非捕获组,不会捕获组内的匹配结果。
  • ?= 是正向前瞻断言,确保匹配后的位置满足条件。
  • ?! 是负向前瞻断言,确保匹配后的位置不满足条件。
JavaScript正则表达式和Java正则表达式在语法上有一些差异,但是它们的基本概念和用法是相似的。下面是将JavaScript正则表达式转换为Java正则表达式的一些常见规则: 1. 语法差异: - JavaScript正则表达式使用斜杠(/)作为定界符,而Java正则表达式使用双引号(")作为定界符。 - JavaScript正则表达式中的特殊字符需要进行转义,而Java正则表达式中的特殊字符不需要转义。 2. 字符类: - JavaScript正则表达式中的字符类使用方括号([])表示,而Java正则表达式中使用方括号([])或者Unicode转义(\p{...})表示。 - JavaScript正则表达式中的字符类可以使用连字符(-)表示范围,而Java正则表达式中需要使用Unicode转义(\uXXXX)表示范围。 3. 量词: - JavaScript正则表达式中的量词使用花括号({})表示,而Java正则表达式中使用花括号({})或者问号(?)表示。 - JavaScript正则表达式中的贪婪量词默认是贪婪模式,而Java正则表达式中的贪婪量词需要在后面添加问号(?)来表示非贪婪模式。 4. 边界匹配: - JavaScript正则表达式中的边界匹配使用插入符号(^)和美元符号($)表示,而Java正则表达式中使用\A和\Z表示。 5. 其他差异: - JavaScript正则表达式中的捕获组使用圆括号(())表示,而Java正则表达式中使用圆括号(())或者方括号([])表示。 - JavaScript正则表达式中的反向引用使用反斜杠加数字(\1、\2等)表示,而Java正则表达式中使用美元符号加数字($1、$2等)表示。 以上是一些常见的JavaScript正则表达式转换为Java正则表达式的规则。具体转换时,还需要根据具体的正则表达式进行适当的调整。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

SmallerFL

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值