Python模块之re正则表达式-CSDN博客

本文链接：https://blog.csdn.net/linzi1994/article/details/82728292

match方法

字符	功能
^	匹配字符串开头
$	匹配字符串结尾

Python中字符串前面加上 r 表示原生字符串，让程序把正则直接当做正则看(不会从字符串开始解释)，有效解决反斜杠转义的问题

Python里数量词默认是贪婪的（在少数语言里也可能是默认非贪婪），总是尝试匹配尽可能多的字符；

非贪婪则相反，总是尝试匹配尽可能少的字符。

贪婪: 量词在范围内,取最多,match方法默认贪婪

print("贪婪", re.match(r"a+", "aaa").group())
输出 贪婪 aaa

非贪婪: 量词在范围内,取最少,只需要在量词后面加一个?

print("非贪婪(量词后面加?)", re.match(r"a+?", "aaa").group())
输出 非贪婪(量词后面加?) a

查询单个内容,返回的是对象,需要用group()获取内容

print(re.search(r"\d+", "aaa111bbb222ccc333ddd").group())
输出 111

查询所有内容,返回的是列表,不需要用group()

print(re.findall(r"\d+", "aaa111bbb222ccc333ddd"))
输出 [111, 222, 333]

sub(正则表示替换的条件,替换的字符, 被替换的字符串,替换的次数), 返回一个字符串

print(re.sub(r"\d+", "###", "aaa111bbb222ccc333ddd", 2))
输出 aaa###bbb###ccc333ddd

split(正则表达式作为分隔符, 被分割的字符串), 返回一个列表

print(re.split(r"\d+", "aaa111bbb222ccc333ddd"))
输出 ['aaa', 'bbb', 'ccc', 'ddd']