Python正则表达式 从邮件中查找发件人和地址

Python正则表达式相关函数

1、re模块相关函数

compile(pattern[, flags])                    根据包含正则表达式的字符串创建模式对象

match(pattern,string[, flags])            在字符串的开始处匹配模式

findall(pattern,string)                         列出字符串中模式的所有匹配项

2、re匹配对象的重要方法

group([group1, ...])                             获取给定子模式(组)的匹配项

start([group])                                       返回给定组的匹配项的开始位置

end([group])                                        返回给定组的匹配项的结束位置

span([group])                                      返回给定组的开始位置和结束位置

 


import fileinput,re
pat = re.compile('From: (.*) <.*?>$')
for line in fileinput.input():
  m = pat.match(line)
  if m:
    print 'Find The Target Line: ',m.group(0)
    print 'Find The Sender: ',m.group(1)

print '\n'
pat = re.compile(r'[a-z\-\.]+@[a-z\-\.]+',re.IGNORECASE)
addresses =  set()
for line in fileinput.input():
  for address in pat.findall(line):
    addresses.add(address)

print 'Find The Email All Address: '
for address in sorted(list(addresses)):
  print address

'''
adds = []
for i in addresses:
  if i not in adds:
    adds.append(i)
print adds
'''


  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值