字符 | 功能 |
---|---|
. | 匹配任意1个字符(除了\n) |
[] | 匹配[ ]中列举的字符 |
\d | 匹配数字,即0-9 |
\D | 匹配非数字,即不是数字 |
\s | 匹配空白,即 空格,tab键 |
\S. | 匹配非空白 |
\w | 匹配单词字符,即a-z、A-Z、0-9、_、汉字 |
\W | 匹配非单词字符 |
* | 匹配前一个字符出现0次或者无限次,即可有可无 |
+ | 匹配前一个字符出现1次或者无限次,即至少有1次 |
? | 匹配前一个字符出现1次或者0次,即要么有1次,要么没有 |
{n} | 匹配前一个字符出现n次 |
{m,n} | 匹配前一个字符出现从m到n次 |
^ | 匹配字符串的开始 |
$ | 匹配字符串的结束 |
\ | 转义符 |
| | 匹配左右任意一个表达式 |
(ab) | 将括号中字符作为一个分组,匹配成功默认group() ,其实每一个()是一组 |
\ | 转义符 |
$ | 匹配字符串的结束 |
\ | 转义符 |
$ | 匹配字符串的结束 |
\ | 转义符 |
变量名匹配 例1:
import re
names = ["age","age1","3age","age!","a_age","a#ge","age_a_"]
for i in names:
ret = re.match(r"^[a-zA-Z_][a-zA-Z_0-9]*$",i)
if ret:
print("变量名%s符合要求,通过正则匹配出来的数据是:%s" % (i, ret.group()))
else:
print("变量名%s不符合要求...." % i)
邮箱匹配 例2:
import re
def main():
email = input("请输入邮箱...")
# 在正则表达式中,如要用到这些字符,如 .,如 ?,等需要用\来转义
ret = re.match(r'[a-zA-Z_0-9]{4,20}@126\.com', email)
if ret:
print("%s输入的邮箱格式正确" % email)
else:
print("%s输入的邮箱格式不正确,请重新输入" % email)
if __name__ == '__main__':
main()
重点"\num" , “(?P)“和”(?P=name)”:分组 例3
import re
def main():
html_str = "<body><h1>hahahnihao</h1></body>"
# 方法一使用"\num"来取匹配到的分组的值
ret = re.match(r"<(\w*)><(\w*)>.*</\2></\1>",html_str)
print(ret.group())
# 方法二 使用"(?P<name>)"和"(?P=name)"来实现取到匹配到的分组的值
ret = re.match(r"<(?P<p1>\w*)><(?P<p2>\w*)>.*</(?P=p2)></(?P=p1)>",html_str)
print(ret.group())
if __name__ == '__main__':
main()