目录
概念
正则表达式(RE)又称正则匹配式、正规表示法,由一组具有特定含义的字符串组成,通常用于匹配、检索和替换文本。
使用方法
元字符:
. :匹配任意符号,除换行符(\n)之外,一个点表示匹配一位
\d : 匹配全部数字
\w :匹配有效符号
\s :空格位
^ : 必须以什么什么开头
$ :必须以什么结尾
[] : 范围列举
| :或
反义符:
\D :匹配不是数字的字符串
\W :匹配特殊符号
\S :匹配非空白位
[^ ] : 匹配除列举以外的符号
转义符
在 Python 中,字符串的 \ 有特殊含义,而在正则中 \ 也存在特殊含义。
这意味着,在Python中,使用正则匹配一个 \ 需要 \\ 来匹配。
解决方法:写的正则表达式建议在括号内最前面加上 r ,表示原样匹配,不再对符号做转译。则 可以敲成 // 。
位数(重复)
* :任意位,0~n
+ :1~n位, 至少有一位
? :0位或者1位
{m} :# 表示有m位
{n,} :表示至少n位
{k,l} :表示至少k位,最多l位
re模块
python 中专门用于正则表达式的模块
re.compile( ):编译
re.search( ):搜索并返回所匹配到的串,只返回第一次匹配到的结果
re.findall( ):查找全部并返回列表
re.finditer( ):查找全部并返回迭代器
re.match( ):匹配
re.sub( ):替换
re.split( ):按照特定的条件分割