第四十三次总结:正则表达式(一),re的高阶用法

正则表达式的简介

它是一个通用的一个表达式

可以适用于任何编程语言

 

 

 

 

python中快速体验

导入模块后使用

 

匹配单个字符

 

在上一小节中,了解到通过re模块能够完成使用正则表达式来匹配字符串

本小节,将要讲解正则表达式的单字符匹配

字符功能
.匹配任意1个字符(除了\n)
[ ]匹配[ ]中列举的字符
\d匹配数字,即0-9
\D匹配非数字,即不是数字
\s匹配空白,即 空格,tab键
\S匹配非空白
\w匹配单词字符,即a-z、A-Z、0-9、_
\W匹配非单词字符

 

匹配多个字符

匹配多个字符的相关格式

字符功能
*匹配前一个字符出现0次或者无限次,即可有可无
+匹配前一个字符出现1次或者无限次,即至少有1次
?匹配前一个字符出现1次或者0次,即要么有1次,要么没有
{m}匹配前一个字符出现m次
{m,n}匹配前一个字符出现从m到n次

 

匹配多个,需要与匹配单个的符号相配合来使用

 

匹配开头结尾

字符功能
^匹配字符串开头
$匹配字符串结尾

 

匹配分组

字符功能
|匹配左右任意一个表达式
(ab)将括号中字符作为一个分组
\num引用分组num匹配到的字符串
(?P<name>)分组起别名
(?P=name)引用别名为name分组匹配到的字符串

 

起名分组(?P<名字>)

给分组起名字

(?P<名字>)

在正则式中获取之前的起名了的小组的数据

(?P=名字)

 

search

需求:匹配出文章阅读的次数

#coding=utf-8
import re
​
ret = re.search(r"\d+", "阅读次数为 9999")
ret.group()

运行结果:

'9999'

 

与match的区别

match是从头开始匹配

search可以从整个字符串是进行搜索

 

 

findall

需求:统计出python、c、c++相应文章阅读的次数

#coding=utf-8
import re
​
ret = re.findall(r"\d+", "python = 9999, c = 7890, c++ = 12345")
print(ret)

运行结果:

['9999', '7890', '12345']

 

 

 

sub 将匹配到的数据进行替换

需求:将匹配到的阅读次数加1

方法1:

#coding=utf-8
import re
​
ret = re.sub(r"\d+", '998', "python = 997")
print(ret)

运行结果:

python = 998

 

小结

re.sub(正则式,替换为什么内容,字符串)

 

 

 

方法2:

#coding=utf-8
import re
​
def add(temp):
    strNum = temp.group()
    num = int(strNum) + 1
    return str(num)
​
ret = re.sub(r"\d+", add, "python = 997")
print(ret)
​
ret = re.sub(r"\d+", add, "python = 99")
print(ret)

运行结果:

python = 998
python = 100

 

小结

re.sub(正则式,函数名,字符串)
匹配成功的内容会作为函数运行时的实参,函数返回的内容会对匹配好的内容进行一个替换

 

 

 

split 根据匹配进行切割字符串,并返回一个列表

需求:切割字符串“info:xiaoZhang 33 shandong”

#coding=utf-8
import re
​
ret = re.split(r":| ","info:xiaoZhang 33 shandong")
print(ret)

运行结果:

['info', 'xiaoZhang', '33', 'shandong']

 

 

 

 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值