最全python模块—re_python re ^,简短的面试总结

网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。

需要这份系统化学习资料的朋友,可以戳这里获取

一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!

‘\w’ 匹配字母和数字,等于[A-Za-z0-9] re.findall(‘\w’,‘alex123,./;;;’)结果[‘a’, ‘l’, ‘e’, ‘x’, ‘1’, ‘2’, ‘3’]
‘\W’ 匹配非英文字母和数字,等于[^A-Za-z0-9] re.findall(‘\W’,‘alex123,./;;;’)结果[‘,’, ‘.’, ‘/’, ‘;’, ‘;’, ‘;’]
‘\s’ 匹配空白字符 re.findall(‘\s’,‘3*ds \t\n’)结果[’ ‘, ‘\t’, ‘\n’]
‘\S’ 匹配非空白字符 re.findall(’\s’,‘3*ds \t\n’)结果[‘3’, ‘*’, ‘d’, ‘s’]
‘\A’ 匹配字符串开头
‘\Z’ 匹配字符串结尾
‘\b’ 匹配单词的词首和词尾,单词被定义为一个字母数字序列,因此词尾是用空白符或非字母数字符来表示的
‘\B’ 与\b相反,只在当前位置不在单词边界时匹配
‘(?P…)’ 分组,除了原有编号外在指定一个额外的别名
re.search(“(?P[0-9]{4})
(?P[0-9]{2})
(?P[0-9]{8})”,“371481199306143242”).groupdict(“city”)
结果{‘province’: ‘3714’, ‘city’: ‘81’, ‘birthday’: ‘19930614’}
[] 是定义匹配的字符范围。比如 [a-zA-Z0-9] 表示相应位置的字符要匹配英文字符和数字。[\s*]表示空格或者*号。


#### 匹配模式



=匹配模式=

#一对一的匹配

‘hello’.replace(old,new)

‘hello’.find(‘pattern’)

#正则匹配
import re
#\w与\W
print(re.findall(‘\w’,‘hello egon 123’)) #[‘h’, ‘e’, ‘l’, ‘l’, ‘o’, ‘e’, ‘g’, ‘o’, ‘n’, ‘1’, ‘2’, ‘3’]
print(re.findall(‘\W’,‘hello egon 123’)) #[’ ', ’ ']

#\s与\S
print(re.findall(‘\s’,‘hello egon 123’)) #[’ ', ’ ', ’ ‘, ’ ‘]
print(re.findall(’\S’,‘hello egon 123’)) #[‘h’, ‘e’, ‘l’, ‘l’, ‘o’, ‘e’, ‘g’, ‘o’, ‘n’, ‘1’, ‘2’, ‘3’]

#\n \t都是空,都可以被\s匹配
print(re.findall(‘\s’,‘hello \n egon \t 123’)) #[’ ', ‘\n’, ’ ', ’ ', ‘\t’, ’ ']

#\n与\t
print(re.findall(r’\n’,‘hello egon \n123’)) #[‘\n’]
print(re.findall(r’\t’,‘hello egon\t123’)) #[‘\n’]

#\d与\D
print(re.findall(‘\d’,‘hello egon 123’)) #[‘1’, ‘2’, ‘3’]
print(re.findall(‘\D’,‘hello egon 123’)) #[‘h’, ‘e’, ‘l’, ‘l’, ‘o’, ’ ', ‘e’, ‘g’, ‘o’, ‘n’, ’ ']

#\A与\Z
print(re.findall(‘\Ahe’,‘hello egon 123’)) #[‘he’],\A==>^
print(re.findall(‘123\Z’,‘hello egon 123’)) #[‘he’],\Z==>$

#^与$
print(re.findall(‘^h’,‘hello egon 123’)) #[‘h’]
print(re.findall(‘3$’,‘hello egon 123’)) #[‘3’]

重复匹配:| . | * | ? | .* | .*? | + | {n,m} |

#.
print(re.findall(‘a.b’,‘a1b’)) #[‘a1b’]
print(re.findall(‘a.b’,‘a1b a*b a b aaab’)) #[‘a1b’, ‘a*b’, ‘a b’, ‘aab’]
print(re.findall(‘a.b’,‘a\nb’)) #[]
print(re.findall(‘a.b’,‘a\nb’,re.S)) #[‘a\nb’]
print(re.findall(‘a.b’,‘a\nb’,re.DOTALL)) #[‘a\nb’]同上一条意思一样

#*
print(re.findall(‘ab*’,‘bbbbbbb’)) #[]
print(re.findall(‘ab*’,‘a’)) #[‘a’]
print(re.findall(‘ab*’,‘abbbb’)) #[‘abbbb’]

#?
print(re.findall(‘ab?’,‘a’)) #[‘a’]
print(re.findall(‘ab?’,‘abbb’)) #[‘ab’]
#匹配所有包含小数在内的数字
print(re.findall(‘\d+.?\d*’,“asdfasdf123as1.13dfa12adsf1asdf3”)) #[‘123’, ‘1.13’, ‘12’, ‘1’, ‘3’]

#.*默认为贪婪匹配
print(re.findall(‘a.*b’,‘a1b22222222b’)) #[‘a1b22222222b’]

#.*?为非贪婪匹配:推荐使用
print(re.findall(‘a.*?b’,‘a1b22222222b’)) #[‘a1b’]

#+
print(re.findall(‘ab+’,‘a’)) #[]
print(re.findall(‘ab+’,‘abbb’)) #[‘abbb’]

#{n,m}
print(re.findall(‘ab{2}’,‘abbb’)) #[‘abb’]
print(re.findall(‘ab{2,4}’,‘abbb’)) #[‘abb’]
print(re.findall(‘ab{1,}’,‘abbb’)) #‘ab{1,}’ ===> ‘ab+’
print(re.findall(‘ab{0,}’,‘abbb’)) #‘ab{0,}’ ===> ‘ab*’

#[]
print(re.findall(‘a[1*-]b’,‘a1b a*b a-b’)) #[]内的都为普通字符了,且如果-没有被转意的话,应该放到[]的开头或结尾
print(re.findall(‘a[^1*-]b’,‘a1b a*b a-b a=b’)) #[]内的^代表的意思是取反,所以结果为[‘a=b’]
print(re.findall(‘a[0-9]b’,‘a1b a*b a-b a=b’)) #[]内的^代表的意思是取反,所以结果为[‘a=b’]
print(re.findall(‘a[a-z]b’,‘a1b a*b a-b a=b aeb’)) #[]内的^代表的意思是取反,所以结果为[‘a=b’]
print(re.findall(‘a[a-zA-Z]b’,‘a1b a*b a-b a=b aeb aEb’)) #[]内的^代表的意思是取反,所以结果为[‘a=b’]

## print(re.findall(‘a\c’,‘a\c’)) #对于正则来说a\c确实可以匹配到a\c,但是在python解释器读取a\c时,会发生转义,然后交给re去执行,所以抛出异常
print(re.findall(r’a\c’,‘a\c’)) #r代表告诉解释器使用rawstring,即原生字符串,把我们正则内的所有符号都当普通字符处理,不要转义
print(re.findall(‘a\\c’,‘a\c’)) #同上面的意思一样,和上面的结果一样都是[‘a\c’]

#():分组
print(re.findall(‘ab+’,‘ababab123’)) #[‘ab’, ‘ab’, ‘ab’]
print(re.findall(‘(ab)+123’,‘ababab123’)) #[‘ab’],匹配到末尾的ab123中的ab
print(re.findall(‘(?:ab)+123’,‘ababab123’)) #findall的结果不是匹配的全部内容,而是组内的内容,?:可以让结果为匹配的全部内容
print(re.findall(‘href=“(.*?)”’,‘点击’))#[‘http://www.baidu.com’]
print(re.findall(‘href=“(?:.*?)”’,‘点击’))#[‘href=“http://www.baidu.com”’]

#|
print(re.findall(‘compan(?:y|ies)’,‘Too many companies have gone bankrupt, and the next one is my company’))


#### re常用方法



=re模块提供的方法介绍=

import re
#1
print(re.findall(‘e’,‘alex make love’) ) #[‘e’, ‘e’, ‘e’],返回所有满足匹配条件的结果,放在列表里
#2
print(re.search(‘e’,‘alex make love’).group()) #e,只到找到第一个匹配然后返回一个包含匹配信息的对象,该对象可以通过调用group()方法得到匹配的字符串,如果字符串没有匹配,则返回None。

#3
print(re.match(‘e’,‘alex make love’)) #None,同search,不过在字符串开始处进行匹配,完全可以用search+^代替match

#4
print(re.split(‘[ab]’,‘abcd’)) #[‘’, ‘’, ‘cd’],先按’a’分割得到’‘和’bcd’,再对’'和’bcd’分别按’b’分割

#5
print(‘=>',re.sub(‘a’,‘A’,‘alex make love’)) #=> Alex mAke love,不指定n,默认替换所有
print(’=>',re.sub(‘a’,‘A’,‘alex make love’,1)) #=> Alex make love
print(‘=>',re.sub(‘a’,‘A’,‘alex make love’,2)) #=> Alex mAke love
print(’=>‘,re.sub(’^(\w+)(.*?\s)(\w+)(.*?\s)(\w+)(.*?)$‘,r’\5\2\3\4\1’,‘alex make love’)) #=> love make alex

print('=>',re.subn(‘a’,‘A’,‘alex make love’)) #=> (‘Alex mAke love’, 2),结果带有总共替换的个数

#6
obj=re.compile(‘\d{2}’)

print(obj.search(‘abc123eeee’).group()) #12
print(obj.findall(‘abc123eeee’)) #[‘12’],重用了obj



import re
print(re.findall(“<(?P<tag_name>\w+)>\w+</(?P=tag_name)>”,“

hello

”)) #[‘h1’]
print(re.search(“<(?P<tag_name>\w+)>\w+</(?P=tag_name)>”,“

hello

”).group()) #

hello


print(re.search(“<(?P<tag_name>\w+)>\w+</(?P=tag_name)>”,“

hello

”).groupdict()) #

hello

print(re.search(r"<(\w+)>\w+</(\w+)>“,”

hello

“).group())
print(re.search(r”<(\w+)>\w+</\1>“,”

hello

").group())



import re

#使用|,先匹配的先生效,|左边是匹配小数,而findall最终结果是查看分组,所有即使匹配成功小数也不会存入结果
#而不是小数时,就去匹配(-?\d+),匹配到的自然就是,非小数的数,在此处即整数

print(re.findall(r"-?\d+.\d*|(-?\d+)",“1-2*(60+(-40.35/5)-(-4*3))”)) #找出所有整数[‘1’, ‘-2’, ‘60’, ‘’, ‘5’, ‘-4’, ‘3’]

#找到所有数字:
print(re.findall(‘\D?(-?\d+.?\d*)’,“1-2*(60+(-40.35/5)-(-4*3))”)) # [‘1’,‘2’,‘60’,‘-40.35’,‘5’,‘-4’,‘3’]



#为何同样的表达式search与findall却有不同结果:
print(re.search(‘(([+-\/]*\d+.?\d*)+)‘,“1-12*(60+(-40.35/5)-(-4*3))”).group()) #(-40.35/5)
print(re.findall(’(([+-\
/]*\d+.?\d*)+)’,“1-12*(60+(-40.35/5)-(-4*3))”)) #[‘/5’, ‘*3’]

#看这个例子:(\d)+相当于(\d)(\d)(\d)(\d)…,是一系列分组
print(re.search(‘(\d)+’,‘123’).group()) #group的作用是将所有组拼接到一起显示出来
print(re.findall(‘(\d)+’,‘123’)) #findall结果是组内的结果,且是最后一个组的结果



#_*_coding:utf-8_*_
author = ‘Linhaifeng’
#在线调试工具:tool.oschina.net/regex/#
import re

s=‘’’
http://www.baidu.com
egon@oldboyedu.com
你好
010-3141
‘’’

#最常规匹配

content=‘Hello 123 456 World_This is a Regex Demo’

res=re.match(‘Hello\s\d\d\d\s\d{3}\s\w{10}.*Demo’,content)

print(res)

print(res.group())

print(res.span())

#泛匹配

content=‘Hello 123 456 World_This is a Regex Demo’

res=re.match(‘^Hello.*Demo’,content)

print(res.group())

#匹配目标,获得指定数据

content=‘Hello 123 456 World_This is a Regex Demo’

res=re.match(‘^Hello\s(\d+)\s(\d+)\s.*Demo’,content)

print(res.group()) #取所有匹配的内容

print(res.group(1)) #取匹配的第一个括号内的内容

print(res.group(2)) #去陪陪的第二个括号内的内容

#贪婪匹配:.*代表匹配尽可能多的字符

import re

content=‘Hello 123 456 World_This is a Regex Demo’

res=re.match(‘^He.*(\d+).*Demo$’,content)

print(res.group(1)) #只打印6,因为.*会尽可能多的匹配,然后后面跟至少一个数字

#非贪婪匹配:?匹配尽可能少的字符

import re

content=‘Hello 123 456 World_This is a Regex Demo’

res=re.match(‘^He.*?(\d+).*Demo$’,content)

print(res.group(1)) #只打印6,因为.*会尽可能多的匹配,然后后面跟至少一个数字

#匹配模式:.不能匹配换行符
content=‘’'Hello 123456 World_This

(1)Python所有方向的学习路线(新版)

这是我花了几天的时间去把Python所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。

最近我才对这些路线做了一下新的更新,知识体系更全面了。

在这里插入图片描述

(2)Python学习视频

包含了Python入门、爬虫、数据分析和web开发的学习视频,总共100多个,虽然没有那么全面,但是对于入门来说是没问题的,学完这些之后,你可以按照我上面的学习路线去网上找其他的知识资源进行进阶。

在这里插入图片描述

(3)100多个练手项目

我们在看视频学习的时候,不能光动眼动脑不动手,比较科学的学习方法是在理解之后运用它们,这时候练手项目就很适合了,只是里面的项目比较多,水平也是参差不齐,大家可以挑自己能做的项目去练练。

在这里插入图片描述

网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。

需要这份系统化学习资料的朋友,可以戳这里获取

一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!

  • 18
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值