python学习：正则表达式

最新推荐文章于 2024-05-01 06:34:45 发布

Sail_Again

最新推荐文章于 2024-05-01 06:34:45 发布

阅读量291

点赞数

分类专栏： python 文章标签： python 正则表达式

python 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

基本规则

1，\d可以匹配一个数字，\w可以匹配一个字母或数字

‘00\d’可以匹配’007’，但无法匹配’00A’；
‘\d\d\d’可以匹配’010’；
‘\w\w\d’可以匹配’py3’；

2，.可以匹配任意字符

‘py.’可以匹配’pyc’、’pyo’、’py!’等等。

3，*表示任意个字符（包括0个），用+表示至少一个字符，用?表示0个或1个字符，用{n}表示n个字符，用{n,m}表示n-m个字符

\d{3}\s+\d{3,8}。

\d{3}表示匹配3个数字，例如’010’；
\s可以匹配一个空格（也包括Tab等空白符），所以\s+表示至少有一个空格，例如匹配’ ‘，’ ‘等；
\d{3,8}表示3-8个数字，例如’1234567’。

4，用[]表示范围

[0-9a-zA-Z_]可以匹配一个数字、字母或者下划线；
[0-9a-zA-Z_]+可以匹配至少由一个数字、字母或者下划线组成的字符串，比如’a100’，’0_Z’，’Py3000’等等；
[a-zA-Z_][0-9a-zA-Z_]*可以匹配由字母或下划线开头，后接任意个由一个数字、字母或者下划线组成的字符串，也就是Python合法的变量；
[a-zA-Z_][0-9a-zA-Z_]{0, 19}更精确地限制了变量的长度是1-20个字符（前面1个字符+后面最多19个字符）。

5，A|B可以匹配A或B

(P|p)ython可以匹配’Python’或者’python’

6，^表示行的开头

^\d表示必须以数字开头

7，$表示行的结束

\d$表示必须以数字结束

使用方法

1，使用r前缀，就可以不考虑转义

s = r’ABC-001’ 匹配 ‘ABC-001’
s = ‘ABC\-001’ 匹配 ‘ABC-001’

2，判断是否匹配成功

test = ‘用户输入的字符串’
if re.match(r’正则表达式’, test):
print(‘ok’)
else:
print(‘failed’)

3，切分字符串

普通方法：’a b c’.split(’ ‘) 结果：[‘a’, ‘b’, ”, ”, ‘c’]
正则表达式：re.split(r’\s+’, ‘a b c’) 结果：[‘a’, ‘b’, ‘c’]

4，提取子串，用()表示的就是要提取的分组（Group）

m = re.match(r’^(\d{3})-(\d{3,8})$’, ‘010-12345’)
m.group(0) ==> ‘010-12345’
m.group(1) ==> ‘010’
m.group(2) ==>’12345’
group(0)永远是原始字符串，group(1)、group(2)……表示第1、2、……个子串

5，正则匹配默认是贪婪匹配，也就是匹配尽可能多的字符