正则表达式测试工具: http://tool.oschina.net/regex/
1.为什么用正则表达式(why)
正则表达式,又称规则表达式,通常被用来检索、替换那些符合某个模式(规则)的文本。
正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合, 组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。这样解析效率非常快
2.常用匹配规则(what)
2.1 基本语法规则
基本的一些语法和形式
2.2 单字符匹配
语法规则里文本构成单字符有数字(digit),空格(space),单词(word)[包括数字,字母以及 _ ]
2.3 多字符匹配
有时候需要匹配一串数字或字符串,则需要匹配多个字符
2.4 匹配边界
2.5 逻辑分组
3.如何使用(how)
re 模块一般使用步骤
1.使用 compile() 函数将正则表达式的字符串形式编译为一个 Pattern 对象
2.通过 Pattern 对象提供的一系列方法对文本进行匹配查找,获得匹配结果,一个 Match 对象。
3.最后使用 Match 对象提供的属性和方法获得信息,根据需要进行其他的操作
【3-1】 compile()函数
正则表达式编译成Pattern对象
import re
#正则表达式编译成Pattern对象
pattern =re.compile(&#