正则表达式

最新推荐文章于 2022-09-22 22:37:16 发布

ircszwfcbvdgk234

最新推荐文章于 2022-09-22 22:37:16 发布

阅读量460

点赞数

分类专栏： python 文章标签：正则表达式

python 专栏收录该内容

92 篇文章 0 订阅

订阅专栏

\d 可以匹配1个数字
\w 可以匹配1个数字或者字母
\s 可以匹配1个空格或者Tab空白符
. 可以匹配1个任意字符

要匹配变长的字符，在正则表达式中，用*表示任意个字符（包括0个），用+表示至少一个字符，用?表示0个或1个字符，用{n}表示n个字符，用{n,m}表示n-m个字符

要匹配'010-12345'这样的号码，由于'-'是特殊字符，在正则表达式中，要用'\'转义，表示为 \-

要做更精确地匹配，可以用[]表示范围，比如：
[0-9a-zA-Z\_]可以匹配一个数字、字母或者下划线；
[0-9a-zA-Z\_]+可以匹配至少由一个数字、字母或者下划线组成的字符串，比如'a100'，'0_Z'，'Py3000'等等；
[a-zA-Z\_][0-9a-zA-Z\_]*可以匹配由字母或下划线开头，后接任意个由一个数字、字母或者下划线组成的字符串，也就是Python合法的变量；
[a-zA-Z\_][0-9a-zA-Z\_]{0, 19}更精确地限制了变量的长度是1-20个字符（前面1个字符+后面最多19个字符）。
A|B可以匹配A或B，所以(P|p)ython可以匹配'Python'或者'python'。
^表示行的开头，^\d表示必须以数字开头。
$表示行的结束，\d$表示必须以数字结束。
你可能注意到了，py也可以匹配'python'，但是加上^py$就变成了整行匹配，就只能匹配'py'了。

Python提供re模块，包含所有正则表达式的功能。
强烈建议使用Python的r前缀，就不用考虑\转义的问题了。

match()方法判断是否匹配，如果匹配成功，返回一个Match对象，否则返回None。常见的判断方法就是：

test = '用户输入的字符串'
if re.match(r'正则表达式', test):
    print('ok')
else:
    print('failed')

切分字符串

用正则表达式切分字符串比用固定的字符更灵活，请看正常的切分代码：
用str.split()方法

>>> 'a b   c'.split(' ')
['a', 'b', '', '', 'c']

嗯，无法识别连续的空格，用正则表达式试试：
用re.split(pattern，string,max=0)方法

>>> re.split(r'\s+', 'a b   c')
['a', 'b', 'c']

无论多少个空格都可以正常分割。加入,试试：

>>> re.split(r'[\s\,]+', 'a,b, c  d')
['a', 'b', 'c', 'd']

再加入;试试：

>>> re.split(r'[\s\,\;]+', 'a,b;; c  d')
['a', 'b', 'c', 'd']

ircszwfcbvdgk234

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
正则表达式

\d 可以匹配1个数字 \w 可以匹配1个数字或者字母 \s 可以匹配1个空格或者Tab空白符 . 可以匹配1个任意字符要匹配变长的字符，在正则表达式中，用*表示任意个字符（包括0个），用+表示至少一个字符，用?表示0个或1个字符，用{n}表示n个字符，用{n,m}表示n-m个字符要匹配'010-12345'这样的号码，由于'-'是特殊字符，在正则表达式中，要用'\'转义，表示为 \-
复制链接

扫一扫