1 问题描述
Python的Flask项目,做上传下载时按照原文件名进行,偶尔会出现中文文件名,当执行下载时在IE中会出现乱码问题。quote是将文件名urlencode化,然后以适应IE浏览器
2 解决方案
import os
from urllib.parse import quote
# from urllib import quote for python2
from flask import request, make_response, send_from_directory
@app.route('/download', methods=["POST"])
def download():
"""文件下载"""
# 获取参数
data_dict = dict(request.form)
file_name = data_dict["filename"]
# 获取文件路径
file_path = os.path.join(os.getcwd())
if os.path.exists(file_path): # 如果存在文件
rsp = make_response(send_from_directory(file_path, file_name, as_attachment=True))
utf_filename = quote(file_name.encode('utf-8'))
rsp.headers["Content-Disposition"] = "attachment;filename*=UTF-8''{}".format(utf_filename)
rsp.headers['Content-Type'] = "application/octet-stream; charset=UTF-8"
return rsp
代码说明:
Content-Disposition中的filename进行了两次URL转码。以汉字“帅”为例:
第一次转码,“帅” 变为 “%E5%B8%85”。
第二次转码,“%E5%B8%85” 变为 “%25E5%25B8%2585”(第二次转码时,因为%是特殊字符,所以会转为%25)。
前端下载时:
Chrome浏览器可以自动执行两次URL解码,所以下载的文件名是正常的。
IE浏览器只执行一次URL解码,所以下载的文件名是第一次编码的结果(%E6%BC%AB)
解决方案是在返回给前端前对Content-Disposition中的filename先进行一次URL解码(实际我是对filename这个参数进行了解码,因为文件服务器是用的第三方的)。
此外,当文件名为中文(未执行URL编码)字符串时,IE下载也为乱码,因为IE对中文字符串又执行了一次URL解码。解决方案是将中文字符串进行URL编码。
所以,总结下来,关键的问题就在于IE浏览器对filename只进行一次解码,而chrome对这种情况是进行了优化的