Python入门知识简述(九)——正则表达式

一.

正则表达式时可匹配文本片段的模式。最简单的正则表达式为普通字符串,与它自己匹配。我们可以使用这种匹配行为来完成如下工作,比如在文本中查找模式,将特定的模式替换为计算得到的值,以及将文本分割成片段。
1.通配符—“.”用句点来表示,它与除换行符之外的其他字符都匹配。
例如’.ython‘与字符串’python‘、’jython‘都匹配,可认为都等价。
2.可对特殊字符进行转义
有些字符本身是特殊字符,如”.”,如果想要使用这个特殊字符而不是使用与它相匹配的其他字符,可对其进行转义,规则是在符号前面加两个“\”。
3.字符集
用[ ]将一个子串括起,可创建一个所谓的字符集。这样的字符集与其包含的字符都匹配。例如’[pj]ython'只与'python''jython'相匹配,不与其它字符串匹配。这样可以更加细致地控制字符。但是要注意的是,字符集一次只匹配一个字符,不会同时匹配两个以上的字符。
Ps:^代表脱字符,与字符集配合使用的话,即可与除^以外的其它字符相匹配。C语言的正则表达式也遵循这个规则。

二.

在python中,模块re提供了对正则表达式的支持,即模块re中的函数都可以使用正则表达式。
下面介绍一些re模块的函数:
compile(pattern[,flags])—根据包含正则表达式的字符串创建模式对象(可提高匹配效率)
search(pattern,string[,flags])—在字符串中查找模式
match(pattern,string[,flage])—在字符串开头匹配模式
split(pattern,string[,maxsplit])—根据模式来分割字符串(可以空格和逗号为分隔符)
findall(pattern,string)—返回一个列表,其中包含字符串中所有与模式匹配的子串
sub(pat,repl,string[,count=0])—将字符串中与模式pat匹配的子串都替换为repl
escape(string)—对字符串中所有的正则表达式特殊字符都进行转义

Ps:本篇博客主要讲述了正则表达式的用法,以及re模块支持正则表达式的一些函数,有关他们的具体应用(代码)下次再写…

阅读更多
想对作者说点什么?

博主推荐

换一批

没有更多推荐了,返回首页