outlock6

最新推荐文章于 2022-07-06 16:33:55 发布

传而习乎

最新推荐文章于 2022-07-06 16:33:55 发布

阅读量7.1k

点赞数

分类专栏： Email & Outlock

本文链接：https://blog.csdn.net/zzddada/article/details/104033485

版权

Email & Outlock 专栏收录该内容

9 篇文章 0 订阅

订阅专栏

#!/usr/bin/python3
# -- coding: utf-8 --

"""
@Author: MarkLiu
"""

import poplib
from email.parser import Parser
from email.header import decode_header
from email.utils import parseaddr
from email import header


def decode_str(s):
    value, charset = decode_header(s)[0]
    if charset:
        value = value.decode(charset)
    return value


def guess_charset(msg):
    # 先从msg对象获取编码:
    charset = msg.get_charset()
    if charset is None:
        # 如果获取不到，再从Content-Type字段获取:
        content_type = msg.get('Content-Type', '').lower()
        pos = content_type.find('charset=')
        if pos >= 0:
            charset = content_type[pos + 8:].strip()
    return charset


def get_email_headers(msg):
    # 邮件的From, To, Subject存在于根对象上:
    headers = {}
    for header in ['From', 'To', 'Subject', 'Date']:
        value = msg.get(header, '')
        if value:
            if header == 'Date':
                headers['date'] = value
            if header == 'Subject':
                # 需要解码Subject字符串:
                subject = decode_str(value)
                headers['subject'] = subject
            else:
                # 需要解码Email地址:
                hdr, addr = parseaddr(value)
                name = decode_str(hdr)
                value = u'%s <%s>' % (name, addr)
                if header == 'From':
                    from_address = value
                    headers['from'] = from_address
                else:
                    to_address = value
                    headers['to'] = to_address
    content_type = msg.get_content_type()
    print('head content_type: ', content_type)
    return headers


# indent用于缩进显示:
def get_email_cntent(message, base_save_path):
    j = 0
    content = ''
    attachment_files = []
    for part in message.walk():
        j = j + 1
        file_name = part.get_filename()
        contentType = part.get_content_type()
        # 保存附件
        if file_name:  # Attachment
            # Decode filename
            h = header.Header(file_name)
            print(h,555555555)
            dh = header.decode_header(h)
            filename = dh[0][0]
            # filename = "88888888888"

            print(filename,11111)
            if dh[0][1]:  # 如果包含编码的格式，则按照该格式解码
                filename = str(filename, dh[0][1])
                filename = filename.encode("utf-8")
                print(dh[0][1],77777)
                # print(filename)
                # print(filename,type(filename))
                pass
            data = part.get_payload(decode=True)
            att_file = open(base_save_path + filename, 'wb')
            attachment_files.append(filename)
            att_file.write(data)
            att_file.close()
        elif contentType == 'text/plain' or contentType == 'text/html':
            # 保存正文
            data = part.get_payload(decode=True)
            charset = guess_charset(part)
            if charset:
                charset = charset.strip().split(';')[0]
                print('charset:', charset)
                data = data.decode(charset)
            content = data
    return content, attachment_files


if __name__ == '__main__':
    # 输入邮件地址, 口令和POP3服务器地址:
    emailaddress = 'zzd6072186@163.com'
    # 注意使用开通POP，SMTP等的授权码
    password = 'zzd6072186'
    pop3_server = 'pop.163.com'

    # 连接到POP3服务器:
    server = poplib.POP3(pop3_server)
    # 可以打开或关闭调试信息:
    # server.set_debuglevel(1)
    # POP3服务器的欢迎文字:
    print(server.getwelcome())
    # 身份认证:
    server.user(emailaddress)
    server.pass_(password)
    # stat()返回邮件数量和占用空间:
    messagesCount, messagesSize = server.stat()
    print('messagesCount:', messagesCount)
    print('messagesSize:', messagesSize)
    # list()返回所有邮件的编号:
    resp, mails, octets = server.list()
    print('------ resp ------')
    print(resp)  # +OK 46 964346 响应的状态 邮件数量 邮件占用的空间大小
    print('------ mails ------')
    print(mails)  # 所有邮件的编号及大小的编号list，['1 2211', '2 29908', ...]
    print('------ octets ------')
    print(octets)

    # 获取最新一封邮件, 注意索引号从1开始:
    length = len(mails)
    for i in range(length):
        resp, lines, octets = server.retr(i + 1)
        print(type(lines[0]), lines, 111)
        # lines存储了邮件的原始文本的每一行,
        # 可以获得整个邮件的原始文本:
        data = [i.decode("utf-8") for i in lines]
        msg_content = '\n'.join(data)
        # 把邮件内容解析为Message对象：
        msg = Parser().parsestr(msg_content)

        # 但是这个Message对象本身可能是一个MIMEMultipart对象，即包含嵌套的其他MIMEBase对象，
        # 嵌套可能还不止一层。所以我们要递归地打印出Message对象的层次结构：
        print('---------- 解析之后 ----------')
        # base_save_path='/media/markliu/Entertainment/email_attachments/'
        base_save_path='./'
        msg_headers = get_email_headers(msg)
        content, attachment_files = get_email_cntent(msg, base_save_path)

        print('subject:', msg_headers['subject'])
        print('from_address:', msg_headers['from'])
        print('to_address:', msg_headers['to'])
        print('date:', msg_headers['date'])
        print('content:', content)
        print('attachment_files: ', attachment_files)

传而习乎

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
outlock6

#!/usr/bin/python3# -- coding: utf-8 --"""@Author: MarkLiu"""import poplibfrom email.parser import Parserfrom email.header import decode_headerfrom email.utils import parseaddrfrom email i...
复制链接

扫一扫

专栏目录