- 正则表达式是字符串处理的有力工具,比字符串自身提供的方法提供了更强大的处理功能。
- 如判断一个字符串是否是合法的Email地址,可以通过构造一个规则(正则表达式),去判断字符串是否能够匹配。
- 正则表达式,又称正规表示式、正规表示法、正规表达式、规则表达式、常规表示法(英语:Regular
Expression,在代码中常简写为regex、regexp或RE),计算机科学的一个概念。 - 正则表达式使用单个字符串来描述、匹配一系列匹配某个句法规则的字符串
- 在很多文本编辑器里,正则表达式通常被用来检索、替换那些匹配某个模式的文本。
- 正则表达式由元字符及其不同组合来构成,通过巧妙地构造正则表达式可以匹配任意字符串,并完成查找、替换、分隔等复杂的字符串处理任务。
元字符
re模块
-
Python通过re模块提供对正则表达式的支持。
-
使用re的一般步骤是先将正则表达式的字符串形式编译为Pattern实例
-
然后使用Pattern实例处理文本并获得匹配结果(一个Match实例)
-
最后使用Match实例获得信息,进行其他的操作。
re.match函数
- re.match 尝试从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功的话,match()就返回