Python正则表达式的使用

1.正则表达式的使用场景:
无法通过切片将字符串的子串返回(查);
借助于replace方法无法完成非固定值或非固定位置的替换(替);
借助split方法无法按照多种值实现字符串的分割(切)。
1.1 查
findall(pattern,string,flags=0)
pattern:指定需要匹配的正则表达式
string:指定待处理的字符串
flags:指定匹配模式,常用的值可以是re.l/re.M/re.S/re.X。re.l的模式是让正则表达式对大小写不敏感;re.M是让正则表达式可以多行匹配;re.S是指明正则表达符号(.可以匹配任意字符,包括换行符\n);re.X是允许正则表达式可以写的更加详细,如多行表示、忽略空白字符、加入注释等等
1.2 替
sub(pattern,repl,string,count=0,flags=0)
pattern:需要匹配的正则表达式
repl:指定替换的新值
string:指定待处理的字符串
1.3 切
split(pattern,string,maxsplit=0,flags=0)
pattern:需要匹配的正则表达式
maxsplit:切割的最大次数,默认为0(没有次数限制)
string:指定待处理的字符串
flags:指定匹配模式。

2.常用的正则符号
1)原字符:指直接存在于字符串内部的子串
2)英文转态的句号.
指代任意字符(数字,字母,标点,汉字等),但除了换行符\n
3)反斜杠
表示转义符,用于转换含义的字符
\n:指代换行
\t:指代Tab制表符
\d:指代0-9中的任意数字
\s:指代任意一种空白(如空格,Tab,换行等)
\w:指代字母、数字和下划线中的任意一种
.:指代句号本身
4)英文转态的中括号[]
指代字符集合,当需要特定字符匹配是,可以选择[]
5)英文转态的圆括号()
指代特定内容的截取(抠)
6)英文状态的问号?
表示匹配前一个字符0次或1次
7)加号+
匹配前一个字符1次及以上
8)星号*
匹配前一个字符0次及以上
9)英文状态的大括号{}
表示匹配前一个字符特定的次数或范围
{m}:匹配前一个字符m次
{m,}:匹配前一个字符至少m次,大于等于m
{m,n}匹配前一个字符m-n次
{,n}:匹配前一个字符最多n次,小于等于n

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值