python中re模块（正则表达式模块）的使用学习

最新推荐文章于 2023-03-10 14:13:42 发布

竹聿Simon

最新推荐文章于 2023-03-10 14:13:42 发布

阅读量4.3k

点赞数

分类专栏： Python Python学习文章标签： python search split findall sub

本文链接：https://blog.csdn.net/churximi/article/details/51558526

版权

Python 同时被 2 个专栏收录

33 篇文章 10 订阅

订阅专栏

Python学习

31 篇文章 15 订阅

订阅专栏

re.match

在字符串的开始位置匹配，如果匹配成功将返回MatchObject（值为True），否则返回None（值为False）。
函数原型

def match(pattern, string, flags=0)

参数说明
- pattern：正则表达式
- string：要匹配的字符串
- flags：控制正则表达式的匹配方式，如：是否区分大小写，多行匹配等

re.search

检测整个字符串，找到第一个匹配项，如果匹配成功将返回MatchObject（值为True），否则返回None（值为False）。
函数原型

def search(pattern, string, flags=0)

参数说明
- pattern：正则表达式
- string：要匹配的字符串
- flags：控制正则表达式的匹配方式，如：是否区分大小写，多行匹配等

re.sub

将字符串中的匹配项替换为其他
函数原型

def sub(pattern, repl, string, count=0, flags=0)

参数说明
- pattern：正则表达式，匹配被替换的项
- repl：替换为该项
- string：要匹配的字符串
- count：替换的个数，默认为0时表示全部替换

re.split

根据匹配项来分割字符串
函数原型

def split(pattern, string, maxsplit=0, flags=0)

参数说明
- pattern：正则表达式
- string：要匹配的字符串
- maxsplit：最大的分割次数，默认为0时表示全部分割

re.findall

获取字符串中的所有匹配项
函数原型

def findall(pattern, string, flags=0)

参数说明
- pattern：正则表达式
- string：要匹配的字符串

re.compile

把正则表达式（以字符串书写的）编译成一个模式对象，提高一定的匹配效率，可用来重复使用
函数原型

def compile(pattern, flags=0)

参数说明
- pattern：正则表达式

实例展示

#!/usr/bin/env python
# -*- coding: utf-8 -*-

"""
功能：学习re模块
时间：2016年6月1日 18:31:01
"""

import re

text = u"这是一个测试句。这是第二个测试句。这是第三个测试句。"

# re.match
a = re.match(u"这是", text)
print u"match " + a.group(0) if a else u"not match"

# re.search
b = re.search(u"一个", text)
print u"search " + b.group(0) if b else u"not search"

# re.sub
c = re.sub(u"测试", u"【测试】", text)
d = re.sub(u"测试", u"【测试】", text, count=1)  # 替换一个
print c, "\n", d

# re.split
e = re.split(u"。", text)
print "\n".join(e)
f = re.split(u"(。)", text)  # 加括号表示保留
print "\n".join(f)

# re.findall
g = re.findall(u"[\u4e00-\u9fa5]+。", text)  # 匹配中文句子
print "\n".join(g)