获取EML邮件头信息,包括发件人,收件人,抄送人,邮件主题,时间,附件等信息。
1. 由于数据量较大,不建议使用xlrd,xlwt,改为使用openpyxl
2. 使用格式:python xxx.py(数据源) (输出源)
3. 针对邮件正文正则截取base64字段,编码后输出暂时无法解决图片及部分格式问题
4. 建议搭配官方email库食用更佳~
我太菜了~
#!/usr/bin/env python3
# -*- coding: utf-8 -*-
from typing import Any
import os
import sys
import re
import openpyxl
import base64
from openpyxl import load_workbook
import email
from email.parser import Parser
workbook = load_workbook('result222.xlsx')
sheet1 = workbook.create_sheet('result')
def decode_str(s): # 字符编码转换
value, charset = email.header.decode_header(s)[0]
if charset:
value = value.decode(charset)
return value
def get_annex_filename(name):
h = email.header.Header(name)
dh = email.header.decode_header(h) # 对附件名称进