正则表达式是一种强大的工具,可以用来匹配、查找、替换字符串中的特定模式。Python 的 re
模块提供了对正则表达式的支持。本文将带你从基础到进阶,逐步了解如何使用 Python 正则表达式进行文本匹配。
1. 导入 re 模块
首先,我们需要导入 Python 的 re
模块。这是使用正则表达式的前提。
import re
2. 基本匹配
最简单的正则表达式就是直接匹配一个固定的字符串。例如,我们想在一个字符串中查找单词 “hello”。
text = "Hello, world! Hello again."
pattern = "hello"
# 使用 re.search() 查找第一个匹配项
match = re.search(pattern, text, re.IGNORECASE) # re.IGNORECASE 表示忽略大小写
if match:
print("找到匹配项:", match.group())
else:
print("没有找到匹配项")
输出:
找到匹配项: Hello
3. 匹配多个字符
正则表达式中的点号 .
可以匹配任何单个字符(除了换行符)。例如,我们想匹配一个三个字符的单词,其中第二个字符可以是任意字符。
text = "cat bat rat mat"
pattern = "c.t"
matches = re.findall(pattern, text)
print("所有匹配项:", matches)
输出:
所有匹配项: ['cat']
4. 匹配字符集
方括号 []
可以用来定义一个字符集,表示匹配其中的任何一个字符。例如,我们想匹配 “a” 或 “e” 开头的单词。
text =