使用了pop3服务。
POP3(Post Office Protocol 3)即邮局协议的第3个版本,它是规定个人计算机如何连接到互联网上的邮件服务器进行收发邮件的协议。
如果是163邮箱, pop3地址及端口等信息如下图。其他邮箱可以搜索查询其的pop3使用方式。
比较重要的一些操作!!
# 连接到POP3服务器
server = poplib.POP3(pop3_server)
# 身份认证
server.user(email)
server.pass_(password)
# 返回邮件数量和每个邮件的大小
server.list()
# pop3.retr 返回由参数标识的邮件的全部文本(具体的含义,动手尝试一下就清楚了)
server.retr(index)
"""
POP3命令码如下:
命令 参数 状态 描述
----------------------------------------------------------------------------
USER username AUTHORIZATION 此命令与下面的pass命令若成功,将导致状态转换
PASS password AUTHORIZATION
APOP Name Digest AUTHORIZATION Digest是MD5消息摘要
----------------------------------------------------------------------------
STAT None TRANSACTION 请求服务器发回关于邮箱的统计资料,如邮件总数和总字节数
UIDL [Msg#] TRANSACTION 返回邮件的唯一标识符,POP3会话的每个标识符都将是唯一的
LIST [Msg#] TRANSACTION 返回邮件数量和每个邮件的大小
RETR [Msg#] TRANSACTION 返回由参数标识的邮件的全部文本
DELE [Msg#] TRANSACTION 服务器将由参数标识的邮件标记为删除,由quit命令执行
RSET None TRANSACTION 服务器将重置所有标记为删除的邮件,用于撤消DELE命令
TOP msg n TRANSACTION 服务器将返回由参数标识的邮件前n行内容,n必须是正整数
NOOP None TRANSACTION 服务器返回一个肯定的响应
------------------------------------------
QUIT None UPDATE
"""
完整代码如下
# coding=utf-8
from email.parser import Parser
from email.header import decode_header
from email.utils import parseaddr
import poplib
import re
# 输入邮件地址, 口令和POP3服务器地址: (切换成自己的邮箱地址与密码)
email = 'xxx@163.com'
password = 'xxpassword'
pop3_server = 'pop.163.com'
def decode_str(s):
"""decode_str()\ guess_charset()\ print_info() 这三个函数都是从网上看到的,用于处理邮件的编码问题。"""
value, charset = decode_header(s)[0]
if charset:
value = value.decode(charset)
return value
def guess_charset(msg):
"""用于处理邮件的编码问题。"""
charset = msg.get_charset()
if charset is None:
content_type = msg.get('Content-Type', '').lower()
pos = content_type.find('charset=')
if pos >= 0:
charset = content_type[pos + 8:].strip()
return charset
def print_info(msg, id):
"""用于处理邮件的编码问题及设置邮件转化后的格式。"""
mail_content = "--------------"+str(id)+"--------------\n"
for header in ['From', 'To', 'Subject']:
value = msg.get(header, '')
if value:
if header == 'Subject':
value = decode_str(value)
else:
hdr, addr = parseaddr(value)
name = decode_str(hdr)
value = u'%s' % (name, addr)
print('%s:%s\n' % (header, value))
mail_content += '%s:%s\n' % (header, value)
# 循环信件中的每一个mime的数据块
for part in msg.walk():
# 这里要判断是否是multipart,是的话,里面的数据是一个message 列表
if not part.is_multipart():
content_type = part.get_content_type()
if content_type == 'text/plain' or content_type == 'multipart/alternative' or content_type == 'multipart/mixed':
content = part.get_payload(decode=True)
charset = guess_charset(part)
if charset:
content = content.decode(charset)
print('Text:%s\n' % content)
mail_content += 'Text:%s\n' % content
else:
print('Attachment:%s\n' % content_type)
mail_content += 'Attachment:%s\n' % content_type
return mail_content
def write2txt(msg):
"""讲提取到的邮件内容写入txt"""
if msg:
with open('/Users/macos/xxx/mail_list.txt', 'a') as f:
f.write(msg)
print("写入txt成功")
def read_email():
# 主工作函数,是此脚本的主干。
# 连接到POP3服务器
server = poplib.POP3(pop3_server)
# 可以打开或关闭调试信息:
server.set_debuglevel(0)
# 可选:打印POP3服务器的欢迎文字:
print(server.getwelcome().decode('utf-8'))
# 身份认证
server.user(email)
server.pass_(password)
# stat() 返回邮件数量和占用空间:
print('Messages:%s. Size:%s' % server.stat())
# list() 返回所有邮件的编号:
resp, mails, octets = server.list()
index = len(mails)
v = 0
for ia in range(1, index):
print("第{}封邮件".format(ia))
resp, lines, otets = server.retr(ia)
msg_content = b'\r\n'.join(lines).decode('utf-8')
msg = Parser().parsestr(msg_content)
sub = msg.get("Subject")
subb = decode_header(sub)[0][0]
if isinstance(subb, str):
subject = subb
print(subject)
else:
subject = subb.decode('utf-8', "ignore")
# 使用正则表达式的规则匹配邮件的标题
pattern = re.compile(r'王总.*?')
if pattern.match(subject):
print("匹配到的邮件编号:{}".format(ia))
mail_list = print_info(msg, ia)
write2txt(mail_list)
v += 1
print("一共打印{}封邮件".format(v))
# 关闭连接:
server.quit()
if __name__ == '__main__':
read_email()