今天看了看python的正则表达式
最关键的就是re模块,就是他是的python有了全部的正则表达式功能。不多说,上程序吧~
import re
line = "Li lei and Han meimei"
pattern = re.compile(r'Li') #re.compile(strPattern[, flag]):将字符串形式的正则表达式编译为pattern对象
match = pattern.match(line)
if match:
print (match.group())
输出是:Li
对于re.compile函数还是有许多要说的,他的那个flag其实可以指定匹配模式。
- re.I(re.IGNORECASE): 忽略大小写(括号内是完整写法,下同)
- M(MULTILINE): 多行模式,改变'^'和'$'的行为(参见上图)
- S(DOTALL): 点任意匹配模式,改变'.'的行为
- L(LOCALE): 使预定字符类 \w \W \b \B \s \S 取决于当前区域设定
- U(UNICODE): 使预定字符类 \w \W \b \B \s \S \d \D 取决于unicode定义的字符属性
- X(VERBOSE): 详细模式。这个模式下正则表达式可以是多行,忽略空白字符,并可以加入注释。
这个用到的时候具体分析吧。
最开始使用的时候我用“lei”而不是"Li"去match,结果输出是空的,结果发现re.match函数是尝试从字符串的开始匹配。其实感觉更像是对系统说“你帮我比对一下这两个字符串看是不是一样的”的感觉。于是如果我要从一长串字符串中找出某个符合的字符呢?
这里就会用到search了。
re.search(pattern,string,flag=0)
这是函数语法,具体用法的话,把上面的程序稍作改动:
import re
line = "Li lei and Han meimei"
pattern = re.compile(r'Han')
match = pattern.search(line)
if match:
print (match.group())
输出结果Han
这才是从line中查找一个叫'Han'的字符串。
这里有一句话能描述两者的区别:re.match只匹配字符串的开始,如果字符串开始不符合正则表达式,则匹配失败,函数返回None;而re.search匹配整个字符串,直到找到一个匹配。
这里有个链接对正则表达式讲的挺全的,记录在此,好好拜读~
http://www.cnblogs.com/huxi/archive/2010/07/04/1771073.html
检索和替换