正则表达式在python中的应用

原创 2006年06月05日 18:14:00

在python处理文本时,采用正则表达式替换,可以方便很多。主要用到 re 模块。

1、一个简单的文本替换例子:

import re
msg=file("test.htm","r+").read()
pattern = '<[^>]*?>'
rpl = ''
msg = re.sub(pattern,rpl,msg)

以上代码过滤掉一个html文件中的所有标记信息(<>中的内容),只保留文本信息

2、(?P<name>[0-9]{1}) 和/g<name>:

pattern = """<img src="/././/images//[a-b]{1}(?P<name>[0-9]{1})/.gif" width="/d+" height="/d+">"""
rpl = """image_/g<name>"""
msg = re.sub(pattern,rpl,msg)

在pattern中使用(?P<name>)匹配搜索内容,然后在rpl中采用 /g<name> 来代表原文中的内容,这样可以达到一些比较特殊的用途,比如重新安排显示格式等。如下例转换日期格式:

import re
msg = "03/24/2004" # convert to 2004-03-24
print msg

pattern = """(?P<month>/d{1,2})/(?P<day>/d{1,2})/(?P<year>/d{2,4})"""
rpl = """/g<year>-/g<month>-/g<day>"""

msg = re.sub(pattern,rpl,msg)

print msg

参考资料:

【PDF】搜集整理:wwwit586com:一个pdf格式的详细介绍

正则表达式校验工具 - 我爱啦查询 :可以马上看到正则表达式可以马上看到替换结果

相关文章推荐

python学习之正则表达式应用

正则表达式应用1.在一段字符中找出tip 或 topimport re st = "top tip taq twp tep" res = r"t[io]p" print re.findall(res,...

python--正则表达式应用

正则对一个简单爬虫程序的改进一个爬虫程序 这是一个提取网页源代码中以.jpg结尾的图片引用,并将其下载的python小程序#!/usr/bin/env python # -*- coding: ut...
  • damant
  • damant
  • 2015年08月13日 15:07
  • 630

python应用regex正则表达式模块re

#!/usr/bin/env python # -*- coding: utf-8 -*- import re def regex(): str = 'abcdab' ...
  • five3
  • five3
  • 2011年12月13日 22:38
  • 13296

Python 正则表达式高级应用举例

首先,写这篇文章的起因,是这两天玩了一个网站     http://www.checkio.org     用Python做题、出题,交流,很有意思也很有挑战。 ————...
  • mayao11
  • mayao11
  • 2012年04月04日 21:08
  • 1112

正则表达式入门及python中的应用

正则表达式入门及python中的应用转载自http://www.cnblogs.com/huxi/archive/2010/07/04/1771073.html1. 正则表达式基础1.1. 简单介绍正...

Python正则表达式指南.pdf

  • 2017年11月10日 16:29
  • 940KB
  • 下载

Python学习 (九 正则表达式)

前言:正则表达式是一种用来匹配字符串的强有力的武器。它的设计思想是用一种描述性的语言来给字符串定义一个规则,凡是符合规则的字符串,我们就认为它“匹配”了,否则,该字符串就是不合法的。...

python正则表达式

  • 2017年05月16日 16:06
  • 6.87MB
  • 下载
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:正则表达式在python中的应用
举报原因:
原因补充:

(最多只允许输入30个字)