先推荐两个教程,写的也很详细,可以参考
正则表达式HOWTO
re — 正则表达式操作
最近自学遇到了一个很困扰的点,就是《电话号码和E-Mail地址提取程序》下面这一段,纠结了一段时间
重新回到基本,单独把那一段程序挑出来,发现源程序里正则表达式最外面是有个括号的,如下面程序,就是三引号外面是跟着一个括号的,因此groups=[groups(0),groups(1)…]
>>> phoneRegex = re.compile(r'''( #👈
(\d{3}|\(\d{3}\))? # 区号可选,444或(444)
(\s|-|\.)? # 分隔符:字符或-或. 可选
(\d{3}) # 三个数字
(\s|-|\.)? # 分隔符:字符或-或. 可选
(\d{4}) # 四个数字
(\s*(ext|x|ext.)\s*(\d{2,5}))? # extension
)''',re.VERBOSE) #👈
>>> phoneRegex.findall('245 8th Street San Francisco, CA 94103 USA Phone: 800.420.7240')
[('800.420.7240', '800', '.', '420', '.', '7240', '', '', '')]
>>> phoneNumRegex=re.compile(r'(\d\d\d)-(\d\d\d)-(\d\d\d\d)')
>>> phoneNumRegex.findall('Cell:415-555-9999 Work:212-555-0000')
[('415', '555', '9999'), ('212', '555', '0000')]
>>> mo1=phoneNumRegex.findall('Cell:415-555-9999 Work:212-555-0000')
>>> mo1
[('415', '555', '9999'), ('212', '555', '0000')]
>>> mo1[0]
('415', '555', '9999')
简单写个,很明显
>>> phoneNumRegex=re.compile(r'((\d\d\d)-(\d\d\d)-(\d\d\d\d))')
>>> phoneNumRegex.findall('Cell:415-555-9999 Work:212-555-0000')
[('415-555-9999', '415', '555', '9999'), ('212-555-0000', '212', '555', '0000')]
>>>
这样findall()返回的元组就是(‘415-555-9999’, ‘415’, ‘555’, ‘9999’)这种,再回到最上面的函数,使用for函数展开findall的元组,如下
>>>groups=('415-555-9999', '415', '555', '9999')
>>>...
>>>groups=('212-555-0000', '212', '555', '0000')
>>>
所以groups[]使用的是1、3、5