# Mail编程
## 电子邮件的历史
- 起源
- 1969 Leonard K. 教授发给同时的 “LO”
- 1971 美国国防部自主的阿帕网(Arpanet)的通讯机制
- 通讯地址里用@,
- 1987年中国的第一份电子邮件
“Across the Great Wall we can reach every corner in the world"
- 管理程序
- Euroda使邮件普及
- Netscape,outlook,foxmail后来居上
- Hotmail使用浏览器发送邮件
- 参考资料
- [官网](https://docs.python.org/3/library/email.mime.html)
## 邮件工作流程
- MUA(MailUserAgent)邮件用户代理
- MTA(MailTransferAgent)邮件传输代理
- MDA(MailDeliveryAgent)邮件投递代理
- laoshi@qq.com, 老师,北京海淀
- xuesheng@sina.com, 学生,上海江岸区
- 流程
1. MUA->MTA, 邮件已经在服务器上了
2. qq MTA->.........->sina MTA, 邮件在新浪的服务器上
3. sina MTA-> sina MDA, 此时邮件已经在你的邮箱里了
4. sina MDA -> MUA(Foxmail/Outlook), 邮件下载到本地电脑
- 编写程序
- 发送: MUA->MTA with SMTP:SimpleMailTransferProtocal,包含MTA->MTA
- 接受: MDA->MUA with POP3 and IMAP:PostOfficeProtocal v3 and InternetMessageAccessProtocal v4
- 准备工作
- 注册邮箱(以qq邮箱为例)
- 第三方邮箱需要特殊设置, 以qq邮箱为例
- 进入设置中心
- 取得授权码
- Python for mail
- SMTP协议负责发送邮件
- 使用email模块构建邮件
- 纯文本邮件
- 案例
# 导入相应的包
import smtplib
from email.mime.text import MIMEText
# MIMEText三个主要参数
# 1. 邮件内容
# 2. MIME子类型,在此案例我们用plain表示text类型
# 3. 邮件编码格式
msg = MIMEText("Hello, i am beijing tulingxueyuan ", "plain", "utf-8")
# 发送email地址,此处地址直接使用我的qq有偶像,密码一般需要临时输入,此处偷懒
from_addr = "1366798119@qq.com"
# 此处密码是经过申请设置后的授权码,不是不是不是你的qq邮箱密码
from_pwd = "hjpovygcxmrshhcj"
# 收件人信息
# 此处使用qq邮箱,我给自己发送
to_addr = "1366798119@qq.com"
# 输入SMTP服务器地址
# 此处根据不同的邮件服务商有不同的值,
# 现在基本任何一家邮件服务商,如果采用第三方收发邮件,都需要开启授权选项
# 腾讯qq邮箱所的smtp地址是 smtp.qq.com
smtp_srv = "smtp.qq.com"
try:
# 两个参数
# 第一个是服务器地址,但一定是bytes格式,所以需要编码
# 第二个参数是服务器的接受访问端口
srv = smtplib.SMTP_SSL(smtp_srv.encode(), 465) #SMTP协议默认端口25
#登录邮箱发送
srv.login(from_addr, from_pwd)
# 发送邮件
# 三个参数
# 1. 发送地址
# 2. 接受地址,必须是list形式
# 3. 发送内容,作为字符串发送
srv.sendmail(from_addr, [to_addr], msg.as_string())
srv.quit()
except Exception as e:
print(e)
- HTML格式邮件发送
- 准备HTML代码作为内容
- 把邮件的subtpye设为html
- 发送
- 案例
from email.mime.text import MIMEText
mail_content = """
<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<title>Title</title>
</head>
<body>
<h1> 这是一封HTML格式邮件</h1>
</body>
</html>
"""
msg = MIMEText(mail_content, "html", "utf-8")
# 构建发送者地址和登录信息
from_addr = "1366798119@qq.com"
from_pwd = "hjpovygcxmrshhcj"
# 构建邮件接受者信息
to_addr = "1366798119@qq.com"
smtp_srv = "smtp.qq.com"
try:
import smtplib
srv = smtplib.SMTP_SSL(smtp_srv.encode(), 465)
srv.login(from_addr, from_pwd)
srv.sendmail(from_addr, [to_addr], msg.as_string())
srv.quit()
except Exception as e:
print(e)
- 发送带附件的邮件
- 可以把邮件看作是一个文本邮件和一个附件的合体
- 一封邮件如果涉及多个部分,需要使用MIMEMultipart格式构建
- 添加一个MIMEText正文
- 添加一个MIMEBase或者MEMEText作为附件
- 案例
from email.mime.text import MIMEText #构建附件使用
from email.mime.multipart import MIMEBase, MIMEMultipart # 构建基础邮件使用
mail_mul = MIMEMultipart()
# 构建邮件正文
mail_text = MIMEText("Hello, i am liudana", "plain", "utf-8")
# 把构建好的邮件正文附加入邮件中
mail_mul.attach(mail_text)
# 构建附加
# 构建附件,需要从本地读入附件
# 打开一个本地文件
# 以rb格式打开
with open("02.html", "rb") as f:
s = f.read()
# 设置附件的MIME和文件名
m = MIMEText(s, 'base64', "utf-8")
m["Content-Type"] = "application/octet-stream"
# 需要注意,
# 1. attachment后分好为英文状态
# 2. filename 后面需要用引号包裹,注意与外面引号错开
m["Content-Disposition"] = "attachment; filename='02.html'"
# 添加到MIMEMultipart
mail_mul.attach(m)
# 发送email地址,此处地址直接使用我的qq有偶像,密码一般需要临时输入,此处偷懒
from_addr = "1366798119@qq.com"
# 此处密码是经过申请设置后的授权码,不是不是不是你的qq邮箱密码
from_pwd = "hjpovygcxmrshhcj"
# 收件人信息
# 此处使用qq邮箱,我给自己发送
to_addr = "1366798119@qq.com"
# 输入SMTP服务器地址
# 此处根据不同的邮件服务商有不同的值,
# 现在基本任何一家邮件服务商,如果采用第三方收发邮件,都需要开启授权选项
# 腾讯qq邮箱所的smtp地址是 smtp.qq.com
smtp_srv = "smtp.qq.com"
try:
import smtplib
srv = smtplib.SMTP_SSL(smtp_srv.encode(), 465) #SMTP协议默认端口25
#登录邮箱发送
srv.login(from_addr, from_pwd)
# 发送邮件
# 三个参数
# 1. 发送地址
# 2. 接受地址,必须是list形式
# 3. 发送内容,作为字符串发送
srv.sendmail(from_addr, [to_addr], mail_mul.as_string())
srv.quit()
except Exception as e:
print(e)
- 添加邮件头, 抄送等信息
- mail["From"] 表示发送着信息,包括姓名和邮件
- mail["To"] 表示接收者信息,包括姓名和邮件地址
- mail["Subject"] 表示摘要或者主题信息
- 案例
from email.mime.text import MIMEText
from email.header import Header
msg = MIMEText("Hello wold", "plain", "utf-8")
# 下面代码故意写错,说明,所谓的发送者的地址,只是从一个Header的第一个参数作为字符串构建的内容
# 用utf8编码是因为很可能内容包含非英文字符
header_from = Header("从图灵学院邮箱发出去的<TuLingXueYuan@qq.cn>", "utf-8")
msg['From'] = header_from
# 填写接受者信息
header_to = Header("去王晓静的地方<wangxiaojing@sina.com>", 'utf-8')
msg['To'] = header_to
header_sub = Header("这是图灵学院的主题", 'utf-8')
msg['Subject'] = header_sub
# 构建发送者地址和登录信息
from_addr = "1366798119@qq.com"
from_pwd = "hjpovygcxmrshhcj"
# 构建邮件接受者信息
to_addr = "1366798119@qq.com"
smtp_srv = "smtp.qq.com"
try:
import smtplib
srv = smtplib.SMTP_SSL(smtp_srv.encode(), 465)
srv.login(from_addr, from_pwd)
srv.sendmail(from_addr, [to_addr], msg.as_string())
srv.quit()
except Exception as e:
print(e)
- 同时支持html和text格式
- 构建一个MIMEMultipart格式邮件
- MIMEMultipart的subtype设置成alternative格式
- 添加HTML和text邮件
- 案例
from email.mime.text import MIMEText
from email.mime.multipart import MIMEMultipart
# 构建一个MIMEMultipart邮件
msg = MIMEMultipart("alternative")
# 构建一个HTML邮件内容
html_content = """
<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<title>Title</title>
</head>
<body>
<h1> 这是一封HTML格式邮件</h1>
</body>
</html>
"""
#
msg_html = MIMEText(html_content, "html", "utf-8")
msg.attach(msg_html)
msg_text = MIMEText("just text content", "plain", "utf-8")
msg.attach(msg_text)
# 发送email地址,此处地址直接使用我的qq邮箱,密码临时输入
from_addr = "1366798119@qq.com"
#from_pwd = input('163邮箱密码: ')
from_pwd = "hjpovygcxmrshhcj"
# 收件人信息:
# 此处使用我注册的163邮箱
to_addr = "1366798119@qq.com"
# 输入SMTP服务器地址:
# 此地址根据每隔邮件服务商有不同的值,这个是发信邮件服务商的smtp地址
# 我用的是qq邮箱发送,此处应该填写腾讯qq邮箱的smtp值,即smtp.163.com,
# 需要开启授权码,
smtp_srv = "smtp.qq.com"
try:
import smtplib
# 加密传输
#server = smtplib.SMTP_SSL(smtp_srv.encode(), 465) # SMTP协议默认端口是25
# qq邮箱要求使用 TLS加密传输
server = smtplib.SMTP(smtp_srv.encode(), 25) # SMTP协议默认端口是25
server.starttls()
# 设置调试级别
# 通过设置调试等级,可以清楚的看到发送邮件的交互步骤
server.set_debuglevel(1)
# 登录发送邮箱
server.login(from_addr, from_pwd)
server.sendmail(from_addr, [to_addr], msg.as_string())
server.quit()
except Exception as e:
print(e)
- 使用smtplib模块发送邮件
- POP3协议接受邮件
- 本质上是MDA到MUA的一个过程
- 从 MDA下载下来的是一个完整的邮件结构体,需要解析才能得到每个具体可读的内容
- 步骤:
1. 用poplib下载邮件结构体原始内容
1. 准备相应的内容(邮件地址,密码,POP3实例)
2. 身份认证
3. 一般会先得到邮箱内邮件的整体列表
4. 根据相应序号,得到某一封信的数据流
5. 利用解析函数进行解析出相应的邮件结构体
2. 用email解析邮件的具体内容
- 案例
# 导入相关包
# poplib负责从MDA到MUA下载
import poplib
# 以下包负责相关邮件结构解析
from email.parser import Parser
from email.header import decode_header
from email.utils import parseaddr
# 得到邮件的原始内容
# 这个过程主要负责从MDA到MUA的下载并使用Parse粗略解析
def getMsg():
# 准备相应的信息
email = "1366798119@qq.com"
# 邮箱的授权码
pwd = "hjpovygcxmrshhcj"
# pop3服务器地址
pop3_srv = "pop.qq.com" # 端口995
# ssl代表是安全通道
srv = poplib.POP3_SSL(pop3_srv)
# user代表email地址
srv.user(email)
# pass_代表密码
srv.pass_(pwd)
# 以下操作根据具体业务具体使用
# stat返回邮件数量和占用空间
# 注意stat返回一个tuple格式
msgs, counts = srv.stat()
print("Messages: {0}, Size: {1}".format(msgs, counts))
# list返回所有邮件编号列表
# mails是所有邮件编号列表
rsp, mails, octets = srv.list()
# 可以查看返回的mails列表类似[b'1 82923', b'2 2184', ...]
print(mails)
# 获取最新一封邮件,注意,邮件索引号是从1开始, 最新代表索引号最高
index = len(mails)
# retr负责返回一个具体索引号的一封信的内容,此内容不具有可读性
# lines 存储邮件的最原始文本的每一行
rsp, lines, octets = srv.retr(index)
# 获得整个邮件的原始文本
msg_count = b'\r\n'.join(lines).decode("utf-8")
# 解析出邮件整个结构体
# 参数是解码后的邮件整体
msg = Parser().parsestr(msg_count)
#关闭链接
srv.quit()
return msg
# 详细解析得到的邮件内容
# msg代表是邮件的原始内容
# idnent代表的是邮件嵌套的层级
def parseMsg(msg, indent=0):
'''
1. 邮件完全可能是有嵌套格式
2. 邮件只有一个From,To,Subject之类的信息
:param msg:
:param indent: 描述邮件里面有几个邮件MIMEXXX类型的内容,展示的时候进行相应缩进
:return:
'''
# 想办法提取出头部信息
# 只有在第一层的邮件中才会有相关内容,
# 此内容只有一个
if indent == 0:
for header in ['From', "To", 'Subject']:
# 使用get可以避免如果没有相关关键字报错的可能性
# 如果没有 关键字”From“, 我们使用 msg["From"]会报错
value = msg.get(header, '')
if value:
# Subject中的内容直接解码就可以,他是字符串类型
if header == 'Subject':
value = decodeStr(value)
# 如果是From和To字段,则内容大概是 "我的邮箱<xxxxx@qq.com>“这种格式
else:
hdr, addr = parseaddr(value)
name = decodeStr(hdr)
# 最终返回形如 "我的邮箱<xxx@qq.com>的格式
value = "{0}<{1}>".format(name, addr)
print("{0}, {1}: {2}".format(indent, header, value))
# 下面代码关注邮件内容本身
# 邮件内容中,有可能是multipart类型,也有可能是普通邮件类型
# 下面的解析使用递归方式
if (msg.is_multipart()):
# 如果是multipart类型,则调用递归解析
# 得到多部分邮件的一个基础邮件部分
parts = msg.get_payload()
# enumerate 函数是内置函数
# 作用是将一个列表,此处是parts,生成一个有索引和parts原内容构成的新的列表
# 例如 enumerate(['a', 'b', 'c']) 结果是: [(1,'a'), (2, 'b'), (3, 'c')]
for n,part in enumerate(parts):
# 一个字符串乘以一个数字的意思是对这个字符串进行n倍扩展
# 比如 ”aa" * 2 -> "aaaa"
print("{0}spart: {1}".format(' '*indent, n))
parseMsg(part, indent+1)
else: # 基础类型
# get_content_type是系统提供函数,得到内容类型
content_type = msg.get_content_type()
# text/plain 或者 text/html是固定值
if content_type == 'text/plain' or content_type == 'text/html':
content = msg.get_payload(decode=True)
charset = guessCharset(msg)
if charset:
content = content.decode(charset)
print("{0}Text: {1}".format(indent, content))
else: #不是文本内容,则应该是附件
print('{0}Attachment: {1}'.format(indent, content_type))
def decodeStr(s):
'''
s代表一封邮件中From,To,Subject中的任一项
对s进行解码,解码是编码的逆过程
:param s:
:return:
'''
value, charset = decode_header(s)[0]
# charset完全可能为空
if charset:
# 如果指定编码,则用指定编码格式进行解码
value = value.decode(charset)
return value
def guessCharset(msg):
'''
猜测邮件的编码格式
:param msg:
:return:
'''
# 调用现成的函数
charset = msg.get_charset()
if charset is None:
# 找到内容类型,并转换成小写
content_type = msg.get("Content-Type", "").lower()
pos = content_type.find("charset=")
if pos >= 0:
# 如果包含chraset,则内容形如 charset=xxxx
charset = content_type[pos+8:].strip()
return charset
if __name__ == "__main__":
# 得到邮件的原始内容
msg = getMsg()
print(msg)
# 精确解析邮件内容
parseMsg(msg, 0)