python正则检验_正则表达式(Python)

正则表达式,又称规则表达式。(英语:Regular Expression,在代码中常简写为regex、regexp或RE),计算机科学的一个概念。正则表达式通常被用来检索、替换那些符合某个模式(规则)的文本。就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。

先写一下我的总结:

预定义:

\A: 表示从字符串的开始处匹配

\Z: 表示从字符串的结束处匹配,如果存在换行,只匹配到换行前的结束字符串

\b:匹配一个单词边界,也就是指单词和空格间的位置。例如,‘py\b’可以匹配’python’中的’py’,但不能匹配’openpyx1’中的’py’。

\B:匹配非单词边界。‘py\b’可以匹配’openpyx1’中的’py’,但不能匹配’python’中的’py’

\d: 匹配任意数字,等价于 [0-9]。 digit

\D:匹配任意非数字字符,等价于[^\d]。 not digit

\s: 匹配任意空白字符,等价于[\t\n\r\f]。 space

\S: 匹配任意非空白字符,等价于[^\s]。

\w: 匹配任意字母数字下划线,等价于 [a-zA-Z0-9]。

\W: 匹配任意非数字字母下划线,等价于 [^\w]

\: 匹配原义的反斜杠\。

特殊符号:

[] 表示范围

| 表示或者

() 表示一组

. 用于匹配除了换行符(\n)之外的所有字符

^ 用于匹配字符串的开始,即行首

$ 用于匹配字符串的末尾(末尾如果有换行符\n,就匹配\n前面的那个字符),即行尾

定义正则验证次数:

*(星号) 用于将前面的模式匹配0次或多次(贪婪模式,即尽可能多的匹配) >=0

+(加号) 用于将前面的模式匹配1次或多次(贪婪模式) >=1

? 用于将前面的模式匹配0次或1次 (贪婪模式) 0,1

{m} 用于验证前面的模式匹配m次

{m,} 用于验证前面的模式匹配m次或者多次

{m,n} 用于验证前面的模式匹配大于等于m次并且小于等于n次

只要跟数量相关,在python里都是贪婪的。 在"*","?","+","{m,n}"后面加上? 就可以使贪婪模式变成非贪婪。

然后来一些比较经典的demo,记得先导入re模块。

用到的函数会有re.match() ,re.search()

importre'''验证手机号码'''phone= input("input the phone number:")

result= re.match('^1[3456789]\d{9}$', phone) #^1(3|4|5|6|7|8|9)\d{9}$,表达式写法不唯一

if result ==None:print("手机号不合法!")else:print("恭喜,验证通过。")

稍微带一点条件的,比如不能是以4、7结尾的手机号:

phone = '18476529115'

print("不是以4、7结尾的手机号:",phone)#result = re.match(r'^1\d{9}[0-35-689]$', phone)

result = re.match(r'^1\d{9}(1|2|3|5|6|8|9)$', phone)print("校验结果:",result)

再来校验一下指定的(qq,163,126)邮箱格式:

print("============================ 邮箱注册 ==============================")

email= input("input the email:")#result = re.match('^\w+@\w+\.com$', email)

result = re.match(r'^\w{5,18}@(163|qq|126)\.(com)$', email) #qq 163 126 邮箱

if result ==None:print("邮箱格式不合法!")else:print("恭喜,验证通过。")

关于分组:

phone = '010-123456789'

#在正则表达式中,一个小括号表示一组

result = re.match(r'(^\d{3}|\d{4})-(\d){9}$', phone)#分组提取 (# 小括号有几个就有几个group)

print(result.group(1))print(result.group(2))

分组引用:

msg2 = '

hello

'

#数字(索引)方式

result = re.match(r'<([0-9a-zA-Z]+)>(.+)\1>$', msg2)#\1>:\1表示引用第一组(小括号)匹配到的内容

print(result)#print(result.group(1))

分组命名(?P<名字>正则表达式)、引用:

#分组命名 (?P<名字>正则)

msg3 = '

hhh

'result= re.match(r'<(?P\w+)><(?P\w+)>(.+)(?P=name2)>(?P=name1)>', msg3)#?P 表示给当前(括号内)组: \w+ 命名为name1#(?P=name1)> 表示引用 名为name1的组的匹配结果

print(result)#运行结果: <_sre.SRE_Match object; span=(0, 25), match='

hhh

'>

re模块的其它函数使用:

'''sub(正则表达式,替换的内容(可以是函数),字符串): 替换

split(正则表达式,字符串) 分割,然后将分割的内容保存到列表中'''newstr= re.sub(r'\d+', '100', 'java:98 python 99')print(newstr) #java:100 python 100

#计算功能函数 +10

defadd(temp):

num=temp.group()

num1= int(num) + 10

returnstr(num1)'''参数为函数add()'''newstr= re.sub(r'\d+', add, '本次考试得分:90')print(newstr) #本次考试得分:100

#分割

result = re.split(r'[,:]', 'java:99,python:98')print(result) #['java', '99', 'python', '98']

贪婪、非贪婪:

只要跟数量相关,在python里都是默认贪婪的。

在"*","?","+","{m,n}"后面加上? 就可以使贪婪模式变成非贪婪。

测试一下:

contents = 'abc123'result= re.match(r'abc(\d+)', contents)print(result) #<_sre.SRE_Match object; span=(0, 6), match='abc123'>

result = re.match(r'abc(\d+?)', contents)print(result) #<_sre.SRE_Match object; span=(0, 4), match='abc1'>

马蜂窝怎么增加粉丝 http://blog.sina.com.cn/s/blog_184e9f38b0102yyi5.html

马蜂窝旅游网增加人气 http://blog.sina.com.cn/s/blog_184e9f38b0102yyig.html

马蜂窝游记怎么刷浏览量 https://www.douban.com/group/topic/162496598/

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值