- 边界限定符:用于匹配单词边界。例如,正则表达式
\bword\b
可以确保只匹配整个单词"word",而不是匹配包含"word"的其他单词。 - 分组和引用:使用括号对多个字符进行分组,并且可以在后续的匹配中引用。例如,正则表达式
(ab)+
可以匹配连续出现的"ab"字符串。 - 修饰符:用于修改匹配规则。例如,re.I修饰符可以实现忽略大小写的匹配。re.M修饰符可以实现多行匹配。
代码讲解:
让我们来看一个简单的示例代码,展示如何使用正则表达式匹配和提取文本中的邮箱地址。
import re
text = "My email is john@example.com. Please contact me at jane@example.com."
pattern = r'\b[A-Za-z0-9.\_%+-]+@[A-Za-z0-9.-]+\.[A-Z|a-z]{2,}\b'
emails = re.findall(pattern, text)
for email in emails:
print(email)
在上述代码中,我们首先导入re模块,这是Python中用于操作正则表达式的标准库。然后,我们定义了一个字符串变量text,其中包含了两个邮箱地址。接下来,我们使用正则表达式r'\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Z|a-z]{2,}\b'
来匹配文本中的邮箱地址。这个正则表达式可以匹配符合邮箱格式的字符串。最后&#x