Python Re

rub00001

于 2009-09-16 23:35:00 发布

阅读量667

点赞数

分类专栏： python 文章标签： python 正则表达式 regex object basic perl

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/rub00001/article/details/4560828

版权

python 专栏收录该内容

16 篇文章 0 订阅

订阅专栏

1. Basic

参考《Python正则表达式操作指南》
模块re，perl风格的正则表达式
regex并不能解决所有的问题，有时候还是需要代码
regex基于确定性和非确定性有限自动机

2. 字符匹配(循序渐进)

元字符

. ^ $ * + ? { [ ] / | ( )

1) "[" 和 "]"常用来指定一个字符类别，所谓字符类别就是你想匹配的一个字符集。如[abc]或者[a-c]。类别中不需分隔符之类的东西

元字符在类别里并不起作用。例如，[akm$]将匹配字符"a", "k", "m", 或 "$" 中的任意一个；"$"通常用作元字符，但在字符类别里，其特性被除去，恢复成普通字符。

2) ^

补集。把"^"作为类别的首个字符；其它地方的"^"只会简单匹配 "^"字符本身。例如，[^5] 将匹配除 "5" 之外的任意字符。

3) /

很牛！

/d 匹配任何十进制数；它相当于类 [0-9]。
/D 匹配任何非数字字符；它相当于类 [^0-9]。
/s 匹配任何空白字符；它相当于类 [ /t/n/r/f/v]。
/S 匹配任何非空白字符；它相当于类 [^ /t/n/r/f/v]。
/w 匹配任何字母数字字符；它相当于类 [a-zA-Z0-9_]。
/W 匹配任何非字母数字字符；它相当于类 [^a-zA-Z0-9_]。

4) .

. 匹配除了换行字符外的任何字符，在 alternate 模式（re.DOTALL）下它甚至可以匹配换行。"." 通常被用于你想匹配“任何字符”的地方。

3. 重复
1) *

匹配0~n个字符，一般不超过最大数

这种重复是“贪婪的”

作用于前一个类别或者字符。如ca*t作用于a，a[bc]*d作用于[bc]

2) +

匹配1~n

3) ?

匹配0~1

4) {m, n}

其中 m 和 n 是十进制整数。该限定符的意思是至少有 m 个重复，至多到 n 个重复。举个例子，a/{1,3}b 将匹配 "a/b"，"a//b" 和 "a///b"。它不能匹配 "ab" 因为没有斜杠，也不能匹配 "ab" ，因为有四个。

其他三个限定符都可以用这样方式来表示。 {0,} 等同于 *，{1,} 等同于 +，而{0,1}则与 ? 相同。如果可以的话，最好使用 *，+，或?。很简单因为它们更短也再容易懂。最后总能这样，有个同一的

4. 例子

1) 生成RE

import re
#RE is a string
p = re.compile('[a-z]+')
print p

2)使用

if p.match(''):
print 'matched'
else:
print 'not matched'

#results: not matched

3) 返回值

m = p.match('abcdef')
if m:
print 'matched again'
else:
print 'not matched again'
print m

#<_sre.SRE_Match object at 0x01031F38>

m is a object of MatchObject which contains:

group() 返回被 RE 匹配的字符串
start() 返回匹配开始的位置
end() 返回匹配结束的位置
span() 返回一个元组包含匹配 (开始,结束) 的位置

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

rub00001 CSDN认证博客专家 CSDN认证企业博客

码龄15年

31: 原创

116万+: 周排名

66万+: 总排名

4万+: 访问

: 等级

816: 积分

0: 粉丝

1: 获赞

4: 评论

3: 收藏

私信

关注

热门文章

分类专栏

C/C++ 1篇
Linux 6篇
Others 9篇
python 16篇
项目管理 3篇

最新评论

清理右键菜单 “用阿里旺旺发送此文件…”
匿名用户: 回复匿名用户：真高手[e03]
清理右键菜单 “用阿里旺旺发送此文件…”
匿名用户: 最佳答案最后终于确定在[HKEY_CLASSES_ROOT/*/shellex/ContextMenuHandlers/OpenFolder] ' @="{0DE1378D-F811-40E6-B60A-1CC56F57D3E9}" '真够狡猾的，用”openfolder“这种于程序毫无关系，甚至给人误解的项名 '直接将此项删除，OK，右键菜单中没了”用阿里旺旺发送此文件“ 试试这个我刚弄的已经删除了 31
程序员的文学修养
yuan_jiang88: 朋友，本人也是位JAVA程序员，读了你的文章，我还真没有搞懂，这篇博文到底是要和我们说什么。没看懂，不过看到《作为意志和表象的世界》这几个字眼却是眼前一亮。本人最近可是迷上了叔本华，其人其书现在想必是很少人知道了，很少人读的。也许我两有些相通之处！
Python 6 Inner Structure
keeng2008: 学得很细心呀，用list可以包装成很多数据结构，比如队列、栈之类的。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。