匹配单个字符
字符 | 功能 |
---|---|
. | 匹配任意1个字符(除了\n) |
[ ] | 匹配[ ]中列举的字符 |
\d | 匹配数字,即0-9 |
\D | 匹配非数字,即不是数字 |
\s | 匹配空白,即 空格,tab键 |
\S | 匹配非空白 |
\w | 匹配单词字符,即a-z、A-Z、0-9、_ |
\W | 匹配非单词字符 |
匹配多个字符
匹配多个字符的相关格式
字符 | 功能 |
---|---|
* | 匹配前一个字符出现0次或者无限次,即可有可无 |
+ | 匹配前一个字符出现1次或者无限次,即至少有1次 |
? | 匹配前一个字符出现1次或者0次,即要么有1次,要么没有 |
{m} | 匹配前一个字符出现m次 |
{m,n} | 匹配前一个字符出现从m到n次 |
匹配开头结尾
字符 | 功能 |
---|---|
^ | 匹配字符串开头 |
$ | 匹配字符串结尾 |
匹配分组
字符 | 功能 |
---|---|
| | 匹配左右任意一个表达式 |
(ab) | 将括号中字符作为一个分组 |
\num | 引用分组num匹配到的字符串 |
(?P<name>) | 分组起别名 |
(?P=name) | 引用别名为name分组匹配到的字符串 |
Python中字符串前面加上 r 表示原生字符串
,
与大多数编程语言相同,正则表达式里使用"\"作为转义字符
,这就可能造成反斜杠困扰。假如你需要匹配文本中的字符"\",那么使用编程语言表示的正则表达式里将需要4个反斜杠"\\":前两个和后两个分别用于在编程语言里转义成反斜杠,转换成两个反斜杠后再在正则表达式里转义成一个反斜杠。
Python里的原生字符串很好地解决了这个问题,有了原生字符串,你再也不用担心是不是漏写了反斜杠,写出来的表达式也更直观。
包含中文
import re
# 身份证号(18位)正则
if re.match(r'[\u4E00-\u9FA5]+',"中"):
print("匹配")
手机匹配
import re
if re.match(r'^((13[0-9])|(14[5|7])|(15([0-3]|[5-9]))|(18[0,5-9]))\d{8}$',"18600000000"):
print("匹配")
车牌匹配
# 车牌号正则
import re
# 身份证号(18位)正则
if re.match(r'^[京津沪渝冀豫云辽黑湘皖鲁新苏浙赣鄂桂甘晋蒙陕吉闽贵粤青藏川宁琼使领A-Z]{1}[A-Z]{1}[A-Z0-9]{4}[A-Z0-9挂学警港澳]{1}$',"京K39006"):
print("匹配")
数字正则
import re
#正整数正则
if re.match(r'^\d*\.?\d+$',"42.3"):
print("匹配")
#负整数正则
if re.match(r'^-\d*\.?\d+$',"-42.2"):
print("匹配")
#整数正则
if re.match(r'^-?\d*\.?\d+$',"-42.32"):
print("匹配")
邮箱匹配
# 邮箱
import re
if re.match(r'^([A-Za-z0-9_\-\.])+\@([A-Za-z0-9_\-\.])+\.([A-Za-z]{2,4})$', "153522217@qq.com"):
print("匹配")
——————————————————————————————————————————————————
# 匹配下列文本y中的每个的邮箱
# y='123@qq.comaaa@163.combbb@126.comasdfasfs33333@adfcom'
import re
y = '123@qq.comaaa@163.combbb@126.comasdfasfs33333@adfcom'
addr_list1 = re.findall(r"[^@]+@[^.]+\.com", y)
addr_list2 = re.findall(r"[^@]+@.+?com", y)
print("1.如果asdfasfs33333@adfcom不是邮箱:")
print(addr_list1)
print()
print("2.如果asdfasfs33333@adfcom也是邮箱:")
print(addr_list2)
print()
print("=" * 44)
print("PS:我也不知道@adfcom这货是不是邮箱,反正两种情况我都会")
整数正则
import re
#正整数正则
if re.match(r'^\d+$',"42"):
print("匹配")
#负整数正则
if re.match(r'^-\d+$',"42"):
print("匹配")
#整数正则
if re.match(r'^-?\d+$',"-42"):
print("匹配")
密码匹配
# # 密码强度正则,最少6位,包括至少1个大写字母,1个小写字母,1个数字,1个特殊字符
import re
if re.match(r'^(?=.*?[A-Z])(?=.*?[a-z])(?=.*?[0-9])(?=.*?[#?!@$%^&*-]).{6,}$',"1aZ1-1211"):
print("匹配")
# 至少1个大写字母English letter,(?=.*?[A-Z])
# 至少1个小写英文字母,(?=.*?[a-z])
# 至少1位数字,(?=.*?[0-9])
# 至少有1个特殊字符,(?=.*?[#?!@$%^&*-])
# 最小8个长度.{8,}
# if re.match(r'(?=.*?[a-z])',"1a"):
# print("匹配 ")
用户名匹配
import re
# 4到16位(字母,数字,下划线,减号)
if re.match(r'^[a-zA-Z0-9_-]{4,16}$', "abwc"):
print("匹配")