python 用poplib收取邮件

import poplib
# 解析邮件
import time
from email.parser import Parser
from email.header import decode_header
from email.utils import parseaddr  # 专门处理地址的模块


# 解析消息头中的字符串
# 没有这个函数,print出来的会使乱码的头部信息。如'=?gb18030?B?yrXWpL3hufsueGxz?='这种
# 通过decode,将其变为中文
def decode_str(s):
    value, charset = decode_header(s)[0]
    if charset:
        value = value.decode(charset)
    return value


# 解码邮件信息分为两个步骤,第一个是取出头部信息
# 首先取头部信息
# 主要取出['From','To','Subject']
def get_header(msg):
    for header in ['From', 'To', 'Subject']:
        value = msg.get(header, '')
        if value:
            # 文章的标题有专门的处理方法
            if header == 'Subject':
                value = decode_str(value)
            elif header in ['From', 'To']:
                # 地址也有专门的处理方法
                hdr, addr = parseaddr(value)
                name = decode_str(addr)
                # value = name + ' < ' + addr + ' > '
                value = name
        print(header + ':' + value)


# 头部信息已取出


# 获取邮件的字符编码,首先在message中寻找编码,如果没有,就在header的Content-Type中寻找
def guess_charset(msg):
    charset = msg.get_charset()
    if charset is None:
        content_type = msg.get('Content-Type', '').lower()
        pos = content_type.find('charset=')
        if pos >= 0:
            charset = content_type[pos + 8:].strip()
    return charset


# 邮件正文部分
# 取附件
# 邮件的正文部分在生成器中,msg.walk()
# 如果存在附件,则可以通过.get_filename()的方式获取文件名称

def get_file(msg):
    for part in msg.walk():
        filename = part.get_filename()
        if filename is not None:  # 如果存在附件
            filename = decode_str(filename)  # 获取的文件是乱码名称,通过一开始定义的函数解码
            data = part.get_payload(decode=True)  # 取出文件正文内容
            # 此处可以自己定义文件保存位置
            path = filename
            f = open(path, 'wb')
            f.write(data)
            f.close()
            print(filename, 'download')


def get_content(msg):
    for part in msg.walk():
        content_type = part.get_content_type()
        charset = guess_charset(part)
        # 如果有附件,则直接跳过
        if part.get_filename() is not None:
            continue
        email_content_type = ''
        content = ''
        if content_type == 'text/plain':
            email_content_type = '内容'
        elif content_type == 'text/html':
            print('html 格式 跳过')
            continue  # 不要html格式的邮件
        if charset:
            try:
                content = part.get_payload(decode=True).decode(charset)
            except AttributeError:
                print('type error')
            except LookupError:
                print("unknown encoding: utf-8")
        if email_content_type == '':
            continue
            # 如果内容为空,也跳过
        print(email_content_type + ' -----  ' + content)


def get_time(msg):
    date1 = time.strptime(msg.get("Date")[0:24], '%a, %d %b %Y %H:%M:%S')  # 格式化收件时间
    date2 = time.strftime("%m-%d %H:%M:%S", date1)  # 邮件时间格式转换
    print(date2)


# get_file(msg)
if __name__ == '__main__':
    email = 'xxxx@xxxx.com'#账户
    password = 'xxxx'#密码

    server = poplib.POP3_SSL('mail.xxxx.com')#邮件的pop地址
    server.user(email)
    server.pass_(password)
    # 登录的过程
    resp, mails, octets = server.list()
    # print(resp, mails, octets)
    index = len(mails)  # 邮件的总数
    print('邮件的总数', index)
    # 此处的循环是取最近的几封邮件
    # for i in range(index - 1, index + 1):
    #     resp, lines, octets = server.retr(i)  # 取邮件
    #     msg_content = b'\r\n'.join(lines).decode('utf-8', 'ignore')
    #     msg = Parser().parsestr(msg_content)
    #     print(resp, lines, octets)
    #     # server.dele(index) 删除邮件
    #     get_header(msg)
    #     get_file(msg)
    #     get_content(msg)
    resp1, lines, octets1 = server.retr(index - 1)
    msg_content = b'\r\n'.join(lines).decode('utf-8', 'ignore')
    msg = Parser().parsestr(msg_content)
    # server.dele(index) 删除邮件
    get_header(msg)
    get_file(msg)
    get_content(msg)
    get_time(msg)
    server.quit()
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值