windows下如何用python抓取邮件内容和附件_用python下载邮件内容

使用了pop3服务。

POP3(Post Office Protocol 3)即邮局协议的第3个版本,它是规定个人计算机如何连接到互联网上的邮件服务器进行收发邮件的协议。

如果是163邮箱, pop3地址及端口等信息如下图。其他邮箱可以搜索查询其的pop3使用方式。

比较重要的一些操作!!

# 连接到POP3服务器

server = poplib.POP3(pop3_server)

# 身份认证

server.user(email)

server.pass_(password)

# 返回邮件数量和每个邮件的大小

server.list()

# pop3.retr 返回由参数标识的邮件的全部文本(具体的含义,动手尝试一下就清楚了)

server.retr(index)

"""

POP3命令码如下:

命令 参数 状态 描述

----------------------------------------------------------------------------

USER username AUTHORIZATION 此命令与下面的pass命令若成功,将导致状态转换

PASS password AUTHORIZATION

APOP Name Digest AUTHORIZATION Digest是MD5消息摘要

----------------------------------------------------------------------------

STAT None TRANSACTION 请求服务器发回关于邮箱的统计资料,如邮件总数和总字节数

UIDL [Msg#] TRANSACTION 返回邮件的唯一标识符,POP3会话的每个标识符都将是唯一的

LIST [Msg#] TRANSACTION 返回邮件数量和每个邮件的大小

RETR [Msg#] TRANSACTION 返回由参数标识的邮件的全部文本

DELE [Msg#] TRANSACTION 服务器将由参数标识的邮件标记为删除,由quit命令执行

RSET None TRANSACTION 服务器将重置所有标记为删除的邮件,用于撤消DELE命令

TOP msg n TRANSACTION 服务器将返回由参数标识的邮件前n行内容,n必须是正整数

NOOP None TRANSACTION 服务器返回一个肯定的响应

------------------------------------------

QUIT None UPDATE

"""

完整代码如下

# coding=utf-8

from email.parser import Parser

from email.header import decode_header

from email.utils import parseaddr

import poplib

import re

# 输入邮件地址, 口令和POP3服务器地址: (切换成自己的邮箱地址与密码)

email = 'xxx@163.com'

password = 'xxpassword'

pop3_server = 'pop.163.com'

def decode_str(s):

"""decode_str()\ guess_charset()\ print_info() 这三个函数都是从网上看到的,用于处理邮件的编码问题。"""

value, charset = decode_header(s)[0]

if charset:

value = value.decode(charset)

return value

def guess_charset(msg):

"""用于处理邮件的编码问题。"""

charset = msg.get_charset()

if charset is None:

content_type = msg.get('Content-Type', '').lower()

pos = content_type.find('charset=')

if pos >= 0:

charset = content_type[pos + 8:].strip()

return charset

def print_info(msg, id):

"""用于处理邮件的编码问题及设置邮件转化后的格式。"""

mail_content = "--------------"+str(id)+"--------------\n"

for header in ['From', 'To', 'Subject']:

value = msg.get(header, '')

if value:

if header == 'Subject':

value = decode_str(value)

else:

hdr, addr = parseaddr(value)

name = decode_str(hdr)

value = u'%s' % (name, addr)

print('%s:%s\n' % (header, value))

mail_content += '%s:%s\n' % (header, value)

# 循环信件中的每一个mime的数据块

for part in msg.walk():

# 这里要判断是否是multipart,是的话,里面的数据是一个message 列表

if not part.is_multipart():

content_type = part.get_content_type()

if content_type == 'text/plain' or content_type == 'multipart/alternative' or content_type == 'multipart/mixed':

content = part.get_payload(decode=True)

charset = guess_charset(part)

if charset:

content = content.decode(charset)

print('Text:%s\n' % content)

mail_content += 'Text:%s\n' % content

else:

print('Attachment:%s\n' % content_type)

mail_content += 'Attachment:%s\n' % content_type

return mail_content

def write2txt(msg):

"""讲提取到的邮件内容写入txt"""

if msg:

with open('/Users/macos/xxx/mail_list.txt', 'a') as f:

f.write(msg)

print("写入txt成功")

def read_email():

# 主工作函数,是此脚本的主干。

# 连接到POP3服务器

server = poplib.POP3(pop3_server)

# 可以打开或关闭调试信息:

server.set_debuglevel(0)

# 可选:打印POP3服务器的欢迎文字:

print(server.getwelcome().decode('utf-8'))

# 身份认证

server.user(email)

server.pass_(password)

# stat() 返回邮件数量和占用空间:

print('Messages:%s. Size:%s' % server.stat())

# list() 返回所有邮件的编号:

resp, mails, octets = server.list()

index = len(mails)

v = 0

for ia in range(1, index):

print("第{}封邮件".format(ia))

resp, lines, otets = server.retr(ia)

msg_content = b'\r\n'.join(lines).decode('utf-8')

msg = Parser().parsestr(msg_content)

sub = msg.get("Subject")

subb = decode_header(sub)[0][0]

if isinstance(subb, str):

subject = subb

print(subject)

else:

subject = subb.decode('utf-8', "ignore")

# 使用正则表达式的规则匹配邮件的标题

pattern = re.compile(r'王总.*?')

if pattern.match(subject):

print("匹配到的邮件编号:{}".format(ia))

mail_list = print_info(msg, ia)

write2txt(mail_list)

v += 1

print("一共打印{}封邮件".format(v))

# 关闭连接:

server.quit()

if __name__ == '__main__':

read_email()

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值