学习PYTHON 之 松散正则表达式

PYTHON允许用户利用所谓的松散正则表达式来完成任务,一个松散正则表达式和一个紧凑正则表达式主要区别表现在两个方面:

·忽略空白符。空格符、制表符、回车符不匹配自身,不参与匹配。

·忽略注释。在松散正则表达式中的注释和put陪你过Python代码中一样:开始于一个#符号,结束于行尾。这种情况下,采用在一个多行字符串中注释,而不是在源代码中注释,以相同的方式工作。

>>> pattern = """
  ^ # beginning of string
  M{0,3} # thousands - 0 to 3 M's
  (CM|CD|D?C{0,3}) # hundreds - 900 (CM), 400 (CD), 0-300 (0 to 3 C's),
	# or 500-800 (D, followed by 0 to 3 C's)
  (XC|XL|L?X{0,3}) # tens - 90 (XC), 40 (XL), 0-30 (0 to 3 X's),
	# or 50-80 (L, followed by 0 to 3 X's)
  (IX|IV|V?I{0,3}) # ones - 9 (IX), 4 (IV), 0-3 (0 to 3 I's),
	# or 5-8 (V, followed by 0 to 3 I's)
  $ # end of string
  """
>>> re.search(pattern, 'M', re.VERBOSE)

 

使用松散正则表达式时,必须传递一个额外的参数re.VERBOSE,该参数是定义在re模块中的一个常量,标志着待匹配的正则表达式是一个松散正则表达式。

 

正则表达式的技巧:

^                     匹配字符串的开始

$                    匹配字符串的结尾

\b                   匹配一个单词的边界

\d                    匹配任意数字

\D                   匹配任意非数字字符

x?                   匹配一个可选的x字符

x+                   匹配0次或者多次x字符

x{n,m}            匹配x字符,至少n次,至多m次

(a|b|c)      要么匹配a,要么匹配b,要么匹配c

(x)                   一般情况下表示一个记忆组(remembered group)。可以利用re.search函数返回对象的groups()函数获取它的值。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值