python正则表达式详解(一)_python的正则表达式(常用详解)

今天抽时间给大家整理一下正则表达式,有的同学可能还是不太懂这个东西,这次你看我的帖子,你就明白了,我写的博客真的通俗易懂,真的一点都不难,希望您耐心看完,保管有用。

正则表达式,主要是做什么用的?这个概念得先理解,明白这个,你就能看懂正则一半了,就是用来匹配数据的,好的,接下来给大家上一些代码和截图:

1.单字符

importre#需求一:匹配如下数据中的手机号(11位的数字):#s = "asdfsdg13789898768sdfksn13889898768000000svccv135898987680000000"#res2 = re.findall("\d{11}", s)#print(res2)

#--------------------单字符(元字符)---------------#1、. :匹配任意一个字符(除\n外)#res = re.findall(".", 'abcd1234?_!&\n')#print(res) #打印结果为 ['a', 'b', 'c', 'd', '1', '2', '3', '4', '?', '_', '!', '&']

#2、[] :列举可以匹配的字符#res = re.findall("[1-3]", 'ab243gzyw53cd1234?_!&\n') # 从后面的字符串中,匹配数字1,2,3#print(res) #打印结果为 ['2', '3', '3', '1', '2', '3']#

#res1 = re.findall("[a-c]", 'ab243gzyw53cd1234?_!&\n') # 从后面的字符串中,匹配字母a到c#print(res1) #打印结果为 ['a', 'b', 'c']#

#res1 = re.findall("[a-c0-9A-Z]", 'ab243gzGDRyw53cd1234?_!&\n') # 从后面的字符串中,匹配所有的数字和字母#print(res1) #打印结果为 ['a', 'b', '2', '4', '3', 'G', 'D', 'R', '5', '3', 'c', '1', '2', '3', '4']

#3、\d:匹配任意一个数字#res = re.findall("\d", 'ab243gzyw53cd1234?_!&\n')#print(res) #打印结果为 ['2', '4', '3', '5', '3', '1', '2', '3', '4']

#4、\D:匹配任意一个非数字#res = re.findall("\D",' ab243gzyw53cd1234?_!&\n') # 除数字之外的都能匹配#print(res) # 打印结果为 [' ', 'a', 'b', 'g', 'z', 'y', 'w', 'c', 'd', '?', '_', '!', '&', '\n']

#5、\s:匹配任意一个空白字符(空格键、tab键、\n符)#res = re.findall("\s", 'ab243gzyw5 3cd1 23 4?_!&\n')#print(res) # 打印结果为 [' ', ' ', ' ', ' ', ' ', ' ', ' ', '\n']

#6、\S:匹配任意一个非空白字符#res = re.findall("\S", 'ab2 43gzyw5')#print(res) # 打印结果为 ['a', 'b', '2', '4', '3', 'g', 'z', 'y', 'w', '5']

#7、\w:匹配任意一个单字符(数字、字母、下划线)#res = re.findall("\w", 'ab243gzyw5 3cd1 23 4?_!&\n')#print(res) # 打印结果为 ['a', 'b', '2', '4', '3', 'g', 'z', 'y', 'w', '5', '3', 'c', 'd', '1', '2', '3', '4', '_']

## 8、\W:匹配任意一个非单词字符(数字字母下划线)#res = re.findall("\W", 'ab243gzyw53cd1234?_!&\n')#print(res) # 打印结果为 ['?', '!', '&', '\n']

看代码,可能您有点烦,看不下去,好,我给您上图:

1867709-20200906233209330-960685266.png

1867709-20200906233220042-226180433.png

2.字符数量

一般表示范围的:如下图所示

1867709-20200909221436463-773171701.png

先给大家附上代码,后面才有截图解析

importre#--------------------字符数量的表示---------------#1、{n}:表示前一个字符连续出现n次#res = re.findall("\d{3}", "123aaa1111bb2323fs55555")#print(res) # 打印结果为 ['123', '111', '232', '555']

#2、{n,m}:表示前一个字符连续出现n-m次#res = re.findall("\d{3,5}", "123aaa1111bb2323fs55555")#print(res) # 打印结果为 ['123', '1111', '2323', '55555']

#3、{n,}:表示前一个字符至少连续出现n次#res = re.findall("\d{3,}", "123aa22a1111bb2323fs55555ss555565745bgg455625765757")#print(res) # 打印结果为 ['123', '1111', '2323', '55555', '555565745', '455625765757']

#贪婪模式:python中正则匹配数量的时候,默认是贪婪模式#非贪婪模式:在表示数量范围后面加个?,就可以关闭贪婪模式#{n,m},{3,},+ ,*#res = re.findall("\d{3,}?", "123aa22a1111bb2323fs55555ss555565745bgg455625765757")#print(res) # 打印结果为 ['123', '111', '232', '555', '555', '565', '745', '455', '625', '765', '757']

#4、+:表示前一个字符至少出现1次以上#res = re.findall("[a-z]+", "123aa22a1111bb2323fs55555ss555565745bgg455625765757")#print(res) # 打印结果为 ['aa', 'a', 'bb', 'fs', 'ss', 'bgg']#

## 5、*:表示前一个字符至少出现0次以上#res = re.findall("[a-z]*", "123aa22a1111bb")#print(res) # 打印结果为 ['', '', '', 'aa', '', '', 'a', '', '', '', '', 'bb', '']

#member_id = 120pwd= "123456"data= '{"member_id":"#member_id#","pwd":"#pwd#"}'res= re.findall("#.+?#", data)print(res)

data2= '{"member_id":"#member_id#","pwd":"#pwd#","user":"#aaa#"}'res2= re.findall("#.+?#", data2)print(res2)

截图解析,一张一张来,傻逼也能看得懂,更何况是聪明机智的正在阅读的你呢

1867709-20200906233416629-729946386.png

1867709-20200906233424363-1382421444.png

另外,这里再给将一个很重要的知识点:贪婪模式与非贪婪模式

1867709-20200906233520798-1546165249.png

1867709-20200906233530737-544950971.png

因为,涉及到这种模式的,还有 + * 等等,现在拿这两种举例,看下图

1867709-20200906233625158-1442584302.png

1867709-20200906233636980-573661639.png

有的同学会问,这有什么实际应用呢?举个例子如何,好,继续往下看,

1867709-20200906233733323-213417761.png

1867709-20200906233740310-1841240475.png

1867709-20200906233751804-2079438904.png

3.字符边界和匹配分组

1867709-20200909221629977-1086521878.png

importre#--------------------字符边界的表示---------------#1、^:表示字符串开头#res = re.findall("^python", "python-00-java-00-php-python")#print(res) # 打印结果为 ['python']

#2、$:表示字符串结尾#res = re.findall("python$", "python-00-java-00-php-python")#print(res) # 打印结果为 ['python']

## 3、\b:表示单词边界#res = re.findall(r"\bpython\b", "python? java-00-java-00-php,python")#print(res) # 打印结果为 ['python', 'python']

#4、\B:表示非单词边界

res = re.findall(r"\Bpython\B", "qqpythonqq? java-00-java-00-php,python")print(res) #打印结果为 ['python']

#--------------------匹配分组的表示---------------#1、|:表示匹配多个规则#匹配3个数字或者三个字母 | 此时可理解为“或者”的意思#res = re.findall("[a-z]{3}|\d{3}", "123aaa11ddd333fff4f4fws")#print(res) # 打印为 ['123', 'aaa', 'ddd', '333', 'fff', 'fws']

## 2、():表示分组

data = '{"member_id":"#member_id#","pwd":"#pwd#","user":"#user#","loan_id":"#loan#"}'

#重点掌握!!!

res = re.findall("#.*?#", data)print(res) #打印为 ['#member_id#', '#pwd#', '#user#', '#loan#']

res= re.findall("#(.*?)#", data)print(res) #打印为 ['member_id', 'pwd', 'user', 'loan']

1867709-20200909222741999-1380918943.png

4.正则参数替换

re模块:使用正则表达式的官方库

re.findall():查找匹配的所有数据,以列表的形式返回

re.search():匹配第一个符合规则的数据,返回一个匹配对象,匹配不到则返回None,此方法常用

re.match():匹配第一个符合规则的数据(必须在字符串的开头),返回一个匹配对象,匹配不到则返回None

re.sub():替换

importre#1、re.search():匹配第一个符合规则的数据,返回一个匹配对象,匹配不到则返回None

data = '{"member_id":"#member_id#","pwd":"#pwd#","user":"#user#","loan_id":"#loan#"}'res= re.search("#(.+?)#", data)print(res)print(res.group())print(res.group(1))#从匹配对象中提取,匹配的内容#group()获取匹配到的数据#group(x)获取匹配到的数据中第x个分组中的内容#print(res.group())#print(res.group(1))

#了解即可#2、re.match():匹配第一个符合规则的数据(必须在字符串的开头),返回一个匹配对象#匹配不到则返回None

data = '{"member_id":"#member_id#","pwd":"#pwd#","user":"#user#","loan_id":"#loan#"}'res= re.match(r"{", data)print(res)classEnvDate:

member_id= 123user= "musen"pwd= "lemonban"loan= 31

#3,sub#data = '{"member_id":"#member_id#","pwd":"#pwd#","user":"#user#","loan_id":"#loan#"}'#data = re.sub("#.+?#",str(EnvDate.member_id),data)#print(data)

1867709-20200909222253267-560504812.png

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值