正则表达式
基本使用
# -*- coding:utf-8 -*-
import re
content = "中国 复兴 中国 加油"
# 从开头开始匹配,如果开头不符合则返回None
result = re.match("中国", content)
print(result)
result = re.match("复兴", content)
print(result)
# 匹配到第一个元素即结束
result = re.search("复兴", content)
print(result)
# 匹配不到返回None
result = re.search("复兴1", content)
print(result)
# 匹配所有元素
result = re.findall("中国", content)
print(result)
# -*- coding:utf-8 -*-
import re
# 匹配字母数字, 6-9位
r = "[0-9a-zA-Z]{6,9}"
result = re.findall(r, "123456")
print(result)
# 匹配QQ号,非0开头,6-10位
r = "[1-9][0-9]{5,9}"
result = re.findall(r, "123456789")
print(result)
#匹配邮箱 {内容}.{内容}@{内容}.{内容}
r = "([\w-]+(\.\w-)*@[\w-]+(\.\w-)*)"
result = re.findall(r, "1234546@163.com")
print(result)
输出:
['123456']
['123456789']
[('1234546@163', '', '')]