import re
re.match()
re.match(pattern, string, flags)
pattern:匹配规则
string:要匹配的文本
flags:匹配方式,可选参数
re.I:不区分大小写
结果形如:
<re.Match object; span=(0, 11), match='https://www'>
想要获得匹配范围,使用span()
re.match(pattern, text, flags).span()
想要获取匹配的内容,使用group()
re.match(pattern, text, flags).group()
NP101 正则查找网址
牛牛最近正在研究网址,他发现好像很多网址的开头都是'https://www',他想知道任意一个网址都是这样开头吗。于是牛牛向你输入一个网址(字符串形式),你能使用正则函数re.match在起始位置帮他匹配一下有多少位是相同的吗?(区分大小写)
import re
s=input()
print(re.match('https://www',s).span())
NP103 截断电话号码
牛牛记录电话号码时,习惯间隔几位就加一个-间隔,方便记忆,同时他还会在电话后面接多条#引导的注释信息。拨打电话时,-可以被手机正常识别,#引导的注释信息就必须要去掉了,你能使用正则匹配re.match将前面的数字及-信息提取出来吗,去掉后面的注释信息。
import re
s=input()
pattern=r'[(\d)-]*'
print(re.match(pattern,s).group())
*表示出现0-n次
\d表示[0-9]
[匹配内容]
re.sub()
详见:re.sub()用法的详细介绍_jackandsnow的博客-CSDN博客
re.sub(pattern, repl, string, count=0, flags=0)
pattern:匹配规则
匹配单个内容:
r'[0-9]':匹配单个数字
r'[A-Z]':匹配单个大写字母
r'[a-z]':匹配单个小写字母
r'[A-Za-z]':匹配单个字母
匹配多个内容:
在单个的基础上加'+'
r'[0-9+]'
r'[A-Z+]'
r'[a-z+]'
r'[A-Za-z+]'
匹配非(内容) :
在单个的前面加'^'
r'[^0-9]'
r'[^A-Z]'
r'[^a-z]'
r'[^A-Za-z]'
repl:替换成的内容(e.g.将所有数字替换成'*')
string:要替换的文本
count:替换次数,默认为0,可选参数
flags:匹配方式,可选参数
NP102 提取数字电话
牛牛翻看以前记录朋友信息的电话薄,电话号码几位数字之间使用-间隔,后面还接了一下不太清楚什么意思的英文字母,你能使用正则匹配re.sub将除了数字以外的其他字符去掉,提取一个全数字电话号码吗?
import re
s=input()
print(re.sub(r'[^0-9]','',s))