python里使用正则表达式的组匹配自引用

原创 2017年11月14日 17:50:42
在前面学习过组的匹配,也就是一个括号包含就叫做一个组。在一个复杂一点的正则表达式里,比如像(1)(2)(3)这样,就匹配三组,如果想在这个表达式里引用前面匹配的组,怎么办呢?其实最简单的方式是通过组号来引用,比如像(1)(2)(3)——\1。使用“\num”的语法来自引用,如下例子:

#python 3.6
#蔡军生 
#http://blog.csdn.net/caimouse/article/details/51749579
#
import re

address = re.compile(
    r'''

    # The regular name
    (\w+)               # first name
    \s+
    (([\w.]+)\s+)?      # optional middle name or initial
    (\w+)               # last name

    \s+

    <

    # The address: first_name.last_name@domain.tld
    (?P<email>
      \1               # first name
      \.
      \4               # last name
      @
      ([\w\d.]+\.)+    # domain name prefix
      (com|org|edu)    # limit the allowed top-level domains
    )

    >
    ''',
    re.VERBOSE | re.IGNORECASE)

candidates = [
    u'First Last <first.last@example.com>',
    u'Different Name <first.last@example.com>',
    u'First Middle Last <first.last@example.com>',
    u'First M. Last <first.last@example.com>',
]

for candidate in candidates:
    print('Candidate:', candidate)
    match = address.search(candidate)
    if match:
        print('  Match name :', match.group(1), match.group(4))
        print('  Match email:', match.group(5))
    else:
        print('  No match')


结果输出如下:

Candidate: First Last <first.last@example.com>
  Match name : First Last
  Match email: first.last@example.com
Candidate: Different Name <first.last@example.com>
  No match
Candidate: First Middle Last <first.last@example.com>
  Match name : First Last
  Match email: first.last@example.com
Candidate: First M. Last <first.last@example.com>
  Match name : First Last
  Match email: first.last@example.com

在这个例子里,就引用了第1组first name和第4组last name的值,实现了前后不一致的EMAIL的姓名,就丢掉它。

深入浅出Numpy
http://edu.csdn.net/course/detail/6149 

Python游戏开发入门

http://edu.csdn.net/course/detail/5690

你也能动手修改C编译器

http://edu.csdn.net/course/detail/5582

纸牌游戏开发

http://edu.csdn.net/course/detail/5538 

五子棋游戏开发

http://edu.csdn.net/course/detail/5487
RPG游戏从入门到精通
http://edu.csdn.net/course/detail/5246
WiX安装工具的使用
http://edu.csdn.net/course/detail/5207
俄罗斯方块游戏开发
http://edu.csdn.net/course/detail/5110
boost库入门基础
http://edu.csdn.net/course/detail/5029
Arduino入门基础
http://edu.csdn.net/course/detail/4931
Unity5.x游戏基础入门
http://edu.csdn.net/course/detail/4810
TensorFlow API攻略
http://edu.csdn.net/course/detail/4495
TensorFlow入门基本教程
http://edu.csdn.net/course/detail/4369
C++标准模板库从入门到精通 
http://edu.csdn.net/course/detail/3324
跟老菜鸟学C++
http://edu.csdn.net/course/detail/2901
跟老菜鸟学python
http://edu.csdn.net/course/detail/2592
在VC2015里学会使用tinyxml库
http://edu.csdn.net/course/detail/2590
在Windows下SVN的版本管理与实战 
http://edu.csdn.net/course/detail/2579
Visual Studio 2015开发C++程序的基本使用 
http://edu.csdn.net/course/detail/2570
在VC2015里使用protobuf协议
http://edu.csdn.net/course/detail/2582
在VC2015里学会使用MySQL数据库
http://edu.csdn.net/course/detail/2672


版权声明:本文为博主原创文章,未经博主允许不得转载。

相关文章推荐

python里使用正则表达式的groups()函数访问组匹配串

前面通过括号()的方式来匹配正则表达式,会发现有多个成立的,如果把这些匹配的结果放到一个元组里,怎么样访问这些匹配的结果呢?在这里使用groups()函数来访问,如下面的例子:#python 3.6 ...

Python正则表达式的几种匹配用法

下面列出Python正则表达式的几种匹配用法:1.测试正则表达式是否匹配字符串的全部或部分regex=ur"" #正则表达式if re.search(regex, subject):    do_so...
  • adermxl
  • adermxl
  • 2011年04月10日 23:02
  • 386

第11章 使用正则表达式的模式匹配(一)

正则表达式 (regular expression) 是一个描述字符模式的对象。JavaScript 的 RegExp 类表示正则表达式,而 String 和 RegExp 都定义了使用正则表达式进行...

第11章 使用正则表达式的模式匹配(二)

11.2 用于模式匹配的 String 方法 迄今为止,虽然本章已经讨论过了用于创建正则表达式的语法,但是我们还没有检验过这些正则表达式在 JavaScript 代码中如何使用。在这一节中,我们将讨...

python 正则表达式的贪婪匹配与非贪婪匹配

#!/usr/local/bin/python #coding:GBK import re fopen=open(r'/tmp/1.txt','r') f=fopen.read().strip() ...

js中使用正则表达式(五)特殊字符、匹配模式、捕获组与反向引用介绍

1、方括号 方括号用于查找某个范围内的字符: 表达式 描述 [abc] 查找方括号之间的任意一个字符,不是多个。 [^abc] 查...

在Python中使用正则表达式同时匹配邮箱和电话并进行简单的分类

在Python使用正则表达式需要使用re(regular exprssion)模块,使用正则表达式的难点就在于如何写好p=re.compile(r' 正则表达式')的内容。 下面是在Python中使用...
  • tdmyl
  • tdmyl
  • 2013年09月04日 14:44
  • 2331

python里使用正则表达式的嵌套可选模式

在前面的例子里开始学习组嵌套的模式匹配,然而使用这个嵌套时,如果碰到选择符(|)就要小心一些了,在下面的例子里就演示了两个不同的正则表达式的差别,例子如下:#python 3.6 #蔡军生 #htt...

正则表达式的匹配规则

  • 2009年04月25日 09:52
  • 19KB
  • 下载

python里使用正则表达式的非捕获模式

在前面使用了分组的模式来匹配正则表达式,比如'a((a+)|(b+))'的分组功能,就会产生三组值返回,如下:'a((a+)|(b+))' (capturing form)  'abbaabbba' ...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:python里使用正则表达式的组匹配自引用
举报原因:
原因补充:

(最多只允许输入30个字)