正则表达式的表示类型
- raw string原生字符串类型:r’\d{5}’
- string类型: ‘\\d{5}’(需要将\的转义消除,即双斜杠表示单斜杠)
Re库主要功能函数
函数 | 说明 |
---|---|
re.search() | 在一个字符串中搜索匹配正则表达式的第一个位置,返回match对象 |
re.match() | 从一个字符串的开始位置起匹配正则表达式,返回match对象 |
re.findall() | 搜索字符串,以列表类型返回全不能匹配的子串 |
re.split() | 将一个字符串按照正则表达式匹配结果进行分割,返回列表类型 |
re.finditer() | 搜索字符串,返回一个匹配结果的得带类型,每个得带元素是match对象 |
re.sub() | 在一个字符串中替换所有匹配正则表达式的子串,返回替换后的字符串 |
- re.search(pattern,string,flags=0)
在一个字符串中搜索匹配正则表达式的第一个位置,返回match对象
- pattern:正则表达式的字符串或原生字符串表示
- string: 待匹配字符串
- flags: 正则表达式使用时的控制标记
- re.I (re.IGNORECASE):忽略正则表达式的大小写,[A-Z]能够匹配小写字符
- re.M (re.MULTILINE): 正则表达式中的^操作符能够将给定字符串的每行当做匹配开始
- re.S (re.DOTALL) :正则表达式中的 . 操作符能够匹配所有字符,默认匹配除了换行符意外的所有字符
- re.match(pattern,string,flags=0)
从一个字符串的开始位置起匹配正则表达式,返回match对象
- pattern:正则表达式的字符串或原生字符串表示
- string: 待匹配字符串
- flags: 正则表达式使用时的控制标记
- re.I (re.IGNORECASE):忽略正则表达式的大小写,[A-Z]能够匹配小写字符
- re.M (re.MULTILINE): 正则表达式中的^操作符能够将给定字符串的每行当做匹配开始
- re.S (re.DOTALL) :正则表达式中的 . 操作符能够匹配所有字符,默认匹配除了换行符意外的所有字符
- -
- re.findall(pattern,string,flags=0)
搜索字符串,以列表类型返回全不能匹配的子串
- pattern:正则表达式的字符串或原生字符串表示
- string: 待匹配字符串
- flags: 正则表达式使用时的控制标记
- re.I (re.IGNORECASE):忽略正则表达式的大小写,[A-Z]能够匹配小写字符
- re.M (re.MULTILINE): 正则表达式中的^操作符能够将给定字符串的每行当做匹配开始
- re.S (re.DOTALL) :正则表达式中的 . 操作符能够匹配所有字符,默认匹配除了换行符意外的所有字符
- -
- re.split(pattern,string,maxsplit=0,flags=0)
将一个字符串按照正则表达式匹配结果进行分割,返回列表类型
- pattern:正则表达式的字符串或原生字符串表示
- string: 待匹配字符串
- maxsplit: 最大分割数,剩余部分作为最后一个元素输出
- flags: 正则表达式使用时的控制标记
- re.I (re.IGNORECASE):忽略正则表达式的大小写,[A-Z]能够匹配小写字符
- re.M (re.MULTILINE): 正则表达式中的^操作符能够将给定字符串的每行当做匹配开始
- re.S (re.DOTALL) :正则表达式中的 . 操作符能够匹配所有字符,默认匹配除了换行符意外的所有字符
re.finditer(pattern, string ,flags=0)
搜索字符串,返回一个匹配结果的得带类型,每个得带元素是match对象- pattern:正则表达式的字符串或原生字符串表示
- string: 待匹配字符串
- flags: 正则表达式使用时的控制标记
- re.I (re.IGNORECASE):忽略正则表达式的大小写,[A-Z]能够匹配小写字符
- re.M (re.MULTILINE): 正则表达式中的^操作符能够将给定字符串的每行当做匹配开始
- re.S (re.DOTALL) :正则表达式中的 . 操作符能够匹配所有字符,默认匹配除了换行符意外的所有字符
re.sub(pattern, repl, string ,count = 0 ,flags = 0)
在一个字符串中替换所有匹配正则表达式的子串,返回替换后的字符串- pattern:正则表达式的字符串或原生字符串表示
- repl: 替换匹配字符串的字符串
- string: 待匹配字符串
- count: 匹配的最大替换次数
- flags: 正则表达式使用时的控制标记
- re.I (re.IGNORECASE):忽略正则表达式的大小写,[A-Z]能够匹配小写字符
- re.M (re.MULTILINE): 正则表达式中的^操作符能够将给定字符串的每行当做匹配开始
- re.S (re.DOTALL) :正则表达式中的 . 操作符能够匹配所有字符,默认匹配除了换行符意外的所有字符
上述方法都是一次性执行操作,我们还可以用编译的方式来操作
regex = re.compile(pattern, flags = 0)
- 将正则表达式的字符串形式编译成正则表达式对象
- pattern : 正则表达式的字符串或者原生字符串表示
- flags : 正则表达式使用时的控制标记
- -