python-re模块

最新推荐文章于 2023-08-03 18:16:39 发布

popopoyou

最新推荐文章于 2023-08-03 18:16:39 发布

阅读量267

点赞数

分类专栏： python

本文链接：https://blog.csdn.net/popopoyou/article/details/47068931

版权

python 专栏收录该内容

9 篇文章 0 订阅

订阅专栏

一、模块介绍

re模块提供了与 Perl 相似l的正则表达式匹配操作。

二、函数和变量:

只列出常用函数：

re.search(pattern, string, flags=0),在字符串中匹配。返回_sre.SRE_Match对象，如果不能匹配返回None。

re.match(pattern, string, flags=0):字符串的开头匹配。返回_sre.SRE_Match对象，如果不能匹配返回None。

re.split(pattern, string, maxsplit=0)通过正则表达式将字符串分割。返回包含分割子串的list对象。

re.compile(pattern, flags=0):编译正则表达式，返回RegexObject对象，然后可以通过RegexObject对象调用match()和search()方法。

re.findall(pattern, string, flags=0):找到匹配的所有子串，返回包含所有子串的list对象。这个匹配是从左到右有序地返回。如果无匹配，返回空列表。

re.sub(pattern, repl, string, count=0, flags=0):找到re 匹配的所有子串，并将其用string替换。可选参数 count 是模式匹配後替换的最大次数。

三、函数作用详解

1、正则表达式必要知识

（1）匹配字符

         .   匹配任意除换行符，也就是“\n”以外的任何字符。
         \ 转义符，改变原来符号含义。
        [ ] 中括号用来创建一个或语义字符集，例如，[abc]匹配a，b或者c当中任意一个字符

^ 把"^"作为首个字符，表示补集来匹配字符，[^5]表示除了5之外所有的字符串。其它地方的"^"只会简单匹配"^"字符本身。在[]外，元字符^表示匹配字符串的开始，如"^ab+"表示以ab开头的字符串

$匹配字符串的结尾或者字符串结尾的换行之前。"foo"既匹配"foo"又匹配"foobar",而"foo$"仅仅匹配"foo".但是在[]里面代表普通字符，如[akm$]将匹配"a","k","m","$"中的任意一个字符。

| 表示或的关系

（2）预定义字符集

       \d    匹配数字，如：[0-9]
       \D   与上面正好相反，匹配所有非数字字符。
       \s     空白字符，如：空格，\t\r\n\f\v等。
       \S    非空白字符。
       \w    单词字符，如：大写A~Z，小写a~z，数字0~9。
       \W   非上面这些字符。

（3）可选项与重复子模式

      *   匹配前一个字符0次或无限次数。
      + 匹配前一个字符1次或无限次数。
     ?   匹配前一个字符0次或1次。
    {m} 匹配前一个字符m次。
    {m,n} 匹配前一个字符m至n次。

      *? 匹配前一个字符0次或无限次数,但尽可能少重复。
      +？匹配前一个字符1次或无限次数,但尽可能少重复。
     ? ？匹配前一个字符0次或1次,但尽可能少重复。
    {m}？匹配前一个字符m次,但尽可能少重复。
    {m,n} ？匹配前一个字符m至n次,但尽可能少重复。