文本体如下:
张三的电话是0411-32423443,网名是Sany Zhang,电子邮箱是zhangsan@vip.163.net。李四的网名是lee@dalian, email是41i@mail.mycom.com.王五的电话是023-23423443,他的邮箱: 500233@yahoo.com赵六的邮箱是zh_6_2020@pc6.com
# -*- coding: <encoding name> -*-
#coding=utf-8
s = '张三的电话是0411-32423443,网名是Sany Zhang,电子邮箱是zhangsan@vip.163.net。李四的网名是lee@dalian, email是41i@mail.mycom.com.王五的电话是023-23423443,他的邮箱: 500233@yahoo.com赵六的邮箱是zh_6_2020@pc6.com'
import re #导入re模块
result = re.findall(r'[\da-z_]+@(?:[\da-z]+\.)+(?:com|net)',s)#r:语法糖,表示非转义的原始字符串; \d 一个数字;a-z:一个小写字母;[]:字符组;+:一个或者多个,(?:)非捕获组只位分组;com|net:不是com就是net或者的意思;
print(result) #打印结果
结果:
[‘zhangsan@vip.163.net’, ‘41i@mail.mycom.com’, ‘500233@yahoo.com’, ‘zh_6_2020@pc6.com’]