Python学习笔记_使用re正则表达式

一、正则单元

1、特殊代码,正则表达式中指定的一些字符,指代一些内容或表达规则。

\b:单词的开始或结束(只能匹配空格隔开的词)

^和$:字符串的开始或结束

{ }:表示重复

[ ]:表示在范围中的选择,其中特殊代码不起作用

|:或

\:转义

( ):分组

\d \w \s 等:指代特定的内容

2、内容单元

数字:\d  [0-9]

字母:[a-zA-Z] 

\w:字母和数字

字母和数字涵盖了大部分内容,剩下的就是字符(一般说的字符会包含字母和数字)。

.:表示非换行符以外的一切字符(包括数字,字母)

\s:空白符

\S: 非空白符

[\s\S]: 表示一切字符

\n:可以匹配换行符

反义:类似\S,\D  \W等,一般形式为[^eg]

3、重复方式,在使用正则表达式时,肯定会面对大量的不确定的重复,解决方法如下:

*:重复零次或更多次

+:重复一次或更多次

?:重复0次或1次

{n}:重复n次

{n,}:重复n次或更多次

{n,m}: 重复n到m次

二、正则规则

 1、替换

满足多种规则中的一种都会被匹配

使用分隔符|,注意顺序:当处于前面的规则满足后就不会执行后面的规则。

个人将[]执行的规则也归在此处,方括号内的项只要有一个匹配到了就视为满足条件。

2、分组

利用()将目标内容括起来,式子中的所有()左括号的出现为计数标准,从左至右被默认的从1开始编号。在正则表达式中可以用\1 \2 等取到相应的匹配到的内容,适合用于相同内容的重复,这波操作也叫后向引用。

在匹配后的提取中可以利用这里的编号取到相应内容。???

形如(?......):匹配但不捕获

eg. re.split(r'(?:,|;|\s)\s*',line)

3、位置指定(待更)

位置指定:

负向位置指定

参考:

python核心编程(第二版) 

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值