Python 的正则表达式(Regular Expressions, 简称 regex 或 RE)用于匹配字符串中的特定模式。正则表达式可以处理文本的查找、替换、分割等操作,广泛应用于字符串处理和数据清理任务中。
在 Python 中,正则表达式功能由 re
模块提供。
常用的正则表达式操作
re.match()
:从字符串的开始位置进行匹配。re.search()
:搜索整个字符串,返回第一个匹配的子串。re.findall()
:返回所有与模式匹配的子串列表。re.sub()
:替换字符串中匹配的部分。re.split()
:按照正则表达式匹配的内容拆分字符串。
正则表达式的常见模式
.
:匹配任意单个字符,除换行符外。^
:匹配字符串的开头。$
:匹配字符串的末尾。*
:匹配前一个字符 0 次或多次。+
:匹配前一个字符 1 次或多次。?
:匹配前一个字符 0 次或 1 次。[]
:匹配指定字符集合中的任意一个字符,如[abc]
匹配a
、b
或c
。{n}
:匹配前一个字符 n 次。|