python进阶——正则表达式

python进阶——正则表达式

1.正则表达式

1.1使用&功能

利用re模块

匹配字符串

1.2函数

re.match(pattern,string,flags=0) //从起始位置开始匹配,如果不是起始位置匹配到就返回none

  • pattern //正则

  • string //匹配的字符串

  • flags //修饰符

group(num=0) //匹配整个表达式的字符串,返回下标对应元组

groups() //返回包含所有的元组

re.search //返回第一个匹配成功的,值同上

re.sub(pattern,repl,string,count=0,flags) //替换

  • pattern //正则

  • repl //替换后内容

  • string //替换前的内容

  • count //替换最大次数,默认0

re.compile(pattern[,flags]) //生成正则表达对象(pattern),提供给其他函数

  • pattern //正则

  • flags //匹配模式

匹配模式:

  1. l //忽略大小写

  2. L //特殊字符集,依赖于当前环境

  3. M //多行模式

  4. S //包括换行符再内的任意字符

  5. U //特殊字符集,依赖于Unicode

  6. X //忽略空格和注释

findall(string[,pos[,endpos]]) //查找所有并返回列表,多个模式则返回元组列表

  • string //字符串

  • pos //指定起始位置,默认为0

  • endpos //结束位置,默认为字符串长度

re.finditer(pattern,string,flags) //查找所有并作为迭代器返回

re.split(pattern,string[,maxsplit,flags]) //将匹配到的内容分割后返回列表

  • maxsplit //分割次数,默认为0

1.3语法

语法描述
^匹配字符串的开头
$匹配字符串的末尾
.匹配任意字符,除了换行符
[...]用来表示一组字符
*匹配0个或多个的表达式
+匹配1个或多个的表达式
?匹配0个或1个由前面的正则表达式定义的片段,非贪婪方式
{ n}精确匹配 n 个前面表达式
{ n,}匹配 n 个前面表达式
{ n, m}匹配 n 到 m 次由前面的正则表达式定义的片段,贪婪方式
a|b匹配a或b
()匹配的内容
(?#)注释
\w匹配字母数字及下划线
\W匹配非字母数字及下划线
\s匹配任意空白字符
\S匹配任意非空字符
\d匹配任意数字
\D匹配任意非数字
\A匹配字符串开始
\Z匹配字符串结束,如果是存在换行,只匹配到换行前的结束字符串
\z匹配字符串结束
\G匹配最后匹配完成的位置
\b匹配一个单词边界,也就是指单词和空格间的位置
\B匹配非单词边界
\n, \t, 等匹配一个换行符
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值