Python POP3读取邮件

最新推荐文章于 2024-05-02 14:57:45 发布

FriendshipT

最新推荐文章于 2024-05-02 14:57:45 发布

阅读量5.8k

点赞数 2

分类专栏： Python日常小操作文章标签： python 开发语言

本文链接：https://blog.csdn.net/FriendshipTang/article/details/123575217

版权

Python日常小操作专栏收录该内容

65 篇文章 11 订阅

订阅专栏

Python POP3收取邮件

前提条件
相关介绍
实验环境
读取邮件

前提条件

熟悉Python基本语法

实验环境

Python 3.x （面向对象的高级语言）
Emain 3.141.0 （python第三方库）
Smtplib （python标准库）
Poplib （python标准库）

读取邮件

获取邮箱授权码

以QQ邮箱为例，登录QQ邮箱->设置->账号->开启POP3/SMTP服务->生成授权码

在这里插入图片描述

主要步骤

第一步：用 poplib 获取邮件的原始文本。
第二步：用 email 解析原始文本，还原为邮件对象。

代码实现

# -*- coding: utf-8 -*-
"""
Created on 2022/03/18 12:00:00
@author: TFX
"""
import poplib
from email.parser import Parser
from email.header import decode_header
from email.utils import parseaddr

def get_origin_text(): # 获取邮件原始文本
	# 连接到POP3服务器
	pop_server = poplib.POP3("pop.qq.com")
	# 邮箱号
	pop_server.user("********@qq.com")
	# 授权码
	pop_server.pass_("********") # 

	# stat()返回(邮件数，邮件尺寸)
	# print('邮件数: %s. 邮件尺寸: %s' % pop_server.stat())
	# list()返回所有邮件的编号列表,默认返回20个元素
	resp, mails, octets = pop_server.list() # 编号最大的为最新的一封

	# 获取最新的一封邮件(索引号从1开始)
	index = len(mails)
	# print(index)
	resp, lines, octets = pop_server.retr(index) # 返回(状态信息，邮件，邮件尺寸)

	# lines存储了邮件的原始文本的每一行,可以获得整个邮件的原始文本
	msg_content = b'\r\n'.join(lines).decode('utf-8') # b表示：后面字符串是bytes类型。
	msg = Parser().parsestr(msg_content)
	# 退出连接
	pop_server.quit()
	return msg

def decode_str(s): # 解码字符串
	value, charset = decode_header(s)[0]
	if charset:
		value = value.decode(charset)
	return value

def set_charset(msg): # 设置字符集
	charset = msg.get_charset() # 获取字符集
	if charset is None:
		content_type = msg.get('Content-Type', '').lower()
		pos = content_type.find('charset=')
		if pos >= 0:
			charset = content_type[pos + 8:].strip()
	return charset

def parse_msg(msg):
	# 解析邮件头
	for header in ['From', 'To', 'Subject']: # 遍历获取发件人，收件人，主题的相关信息
		value = msg.get(header, '') # 获取邮件头的内容
		if value:
			if header=='Subject': # 获取主题的信息，并解码
				value = decode_str(value) # 解码字符串
			else:
				hdr, addr = parseaddr(value) # 解析字符串中的邮件地址
				name = decode_str(hdr) # 解码字符串
				value = '%s <%s>' % (name, addr)
		print('%s: %s' % (header, value))
	
	# 解析邮件正文
	if (msg.is_multipart()):# 如果消息由多个部分组成，则返回True
		parts = msg.get_payload() # 返回一个包含邮件所有的子对象的列表
		for n, part in enumerate(parts): # 枚举，遍历各个对象
			print('part %s' % (n))
			parse_msg(part)
	else:
		content_type = msg.get_content_type() # 获取邮件信息的内容类型
		if content_type=='text/plain' or content_type=='text/html': # 如果是纯文本或者html类型
			content = msg.get_payload(decode=True)# 返回一个包含邮件所有的子对象(已解码)的列表
			charset = set_charset(msg) # 设置字符集
			if charset: # 字符集不为空
				content = content.decode(charset) # 解码
			print('Text: %s' % (content))
		else:
			print('Attachment: %s' % (content_type)) # 附件

if __name__=="__main__":
	msg = get_origin_text() # 第一步：用 poplib 获取邮件的原始文本。
	parse_msg(msg) # 第二步：用 email 解析原始文本，还原为邮件对象。