你有没有过这种经历:慌慌张张地去会议室开会,突然发现自己需要的文件却在工位的台式电脑中。因为文件比较大大,通过互联网下载需要很长时间。如果用网盘来中转放在两个电脑上的文件,传输速度又很慢。
我猜这个时候你就会想:如果能用一台电脑实现文件的上传和下载,那文件传输是不是就非常方便快速了。
这当然是可以实现的。所以今天,就教你怎样用 Python 基于 HTTP 协议,来实现跨操作系统的文件上传和下载功能。
今天要学习的代码都不长,比较精简,又和文字相得益彰,所以学起来也不会太累。那接下来就跟着我的思路走,我们先来了解一下使用 Python 来实现文件上传和下载的优势。
为什么要使用 Python?
实现文件下载的软件,相信你也用过很多,比如微信、QQ。用这些软件来传输文件,不仅要连接互联网,而且还有文件大小的限制。那如果用商业软件呢?传输虽然方便,但是就不能跨操作系统,而且还有可能需要付费。
所以综合下来,既要免费,又要传输快、没有大小限制的实现方式有没有呢?聪慧如你,一定知道接下来我会开始讲怎么用 Python 来实现文件的上传和下载功能了。别着急,还要再唠叨几句关于用 Python 来实现的优势,这样你会学得更有劲儿。
首先,用法简单。只要一行代码,就能实现文件的浏览和下载功能。
其次,跨操作系统,适用范围广。只要安装了 Python 默认支持的文件下载需要的模块,那么在 Windows、macOS、Linux 上就都能用。
最后,传输速度快。和网盘、微信不同,Python 的文件下载功能,是基于局域网通信的,不需要通过互联网中转,所以也就没有了传输速度和文件大小的限制。
知道了用 Python 来实现的优势,那接下来我们就进入正题。会结合代码,来讲解用 Python 怎么实现文件的浏览和下载功能。
一行代码,实现文件的浏览和下载
使用 Python 实现文件的浏览和下载,只需要一行代码。如下:
python3 -m http.server 8080
通过在命令行运行这行代码之后,就能通过“http:// 你的 IP 地址:8080”浏览和下载文件了。
这行代码很简单,但你要仔细看的话,会发现这行代码的执行过程和我们之前执行脚本的过程有比较大的差别,而且通过“http.server”模块的加载就直接运行了 Python 的脚本,这两种功能都是我们之前没有接触过的。
虽然没有接触过,但是学起来不会很难,那么接下来我就从怎么通过命令行运行模块,以及怎么使用模块提供一个 HTTP 服务这两方面来讲解这行代码。
如何通过命令行运行模块
要通过命令行运行一个模块,我们需要先通过 Python 命令找到“http.server”模块的第一条命令,然后再来执行。而找到“http.server”模块,非常关键的就是"-m"参数。重点讲解一下。
从执行方式上,这行代码和我们以往执行的代码不同。我在 Python 命令和模块之间使用了“-m”参数,而且“-m”参数后面会跟着要执行的 Python 的模块“http.server”。
“http.server”在你电脑中保存的路径是“/ 模块所在目录 /http/server.py”,它也是一个“.py”结尾的文件,会被保存在你电脑上 Python 文件夹中的“lib”文件夹下。
如果不使用“-m”参数,那就像我们之前执行的代码一样,Python 会执行当前目录下的.py 文件。所以在这里你要特别注意一下,增加了“-m”参数前后,执行的.py 文件位置是不同的。
如果要查看这个模块是怎样通过 Python 实现的,那么我们需要先找到这个模块的所在目录。核心实现代码写了出来,供你参考。
$ python3
>>> import http
>>> http.__file__
'/Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/http/__init__.py'
在这段代码中,我使用了我们之前学习过的内置变量“file”,得到了该模块所在的位置。在以后的工作中,你可以使用这种方式查找任意一个你想要了解的模块位置。
不过你也要知道,由于你在安装 Python 时,会根据自己的习惯选择自定义的目录,或者你使用的是 Windows 操作系统,所以你得到的目录可能会和我不同,但这并不影响你阅读查找该模块的实现代码。
如果你还想查看 Python 其他模块保存在哪个目录,可以在没有加载模块的前提下,获得所有模块的位置,代码如下:
import sys
sys.path
# 执行结果
['', '/Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7', '/Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages']
你会发现,在执行“sys.path”得到的列表中,还会出现一个“site-packages”目录,这个目录是你使用 pip3 安装的第三方模块默认的位置。当你需要学习 Python 库的代码时,可以使用这个方法找到所有安装的包的目录。
“-m”参数不但能让 Python 从“sys.path”中找到要执行的模块,还能够自动执行这个模块。以“http.server”为例,Python 会首先找到“lib/python3.7/http/server.py”, 然后运行“server.py”文件。
由于该文件中使用了“if name == 'main':”这样一条语句,所以 Python 会从这一行开始执行“server.py”文件。此外,还为“http.server”指定了参数“8080”, “server.py”会通过“argparse”库对“8080”这个参数进行处理。
如何使用“http.server”模块提供 HTTP 服务
刚才我们讲了怎么通过命令行来运行“http.server”模块,事实上,这个模块 **** 是基于 HTTP 协议实现的文件浏览和下载功能。接下来我们就先了解一下HTTP 协议的主要工作过程。
使用 HTTP 协议的好处是它能够跨平台,而且还比其他协议简单。那么要想掌握 HTTP 协议,你得要知道 HTTP 协议提供了两种角色:
为其他人提供服务的服务端;
享受服务的客户端。
我们一般把“http.server”称为 HTTP 服务端,把浏览器称作 HTTP 客户端。服务端和客户端通信时,会采用它们的主要协议 --HTTP 协议。
它们的通信过程就像是在打电话,当你给对方打电话时,首先要输入对方的手机号码。同理,在计算机中,手机号码就是服务端的 IP 地址和端口,接通电话后,双方要想互相听懂要传递的信息,必须使用一种双方都能理解的语言,这个语言在计算机中就是 HTTP 协议。所以一句话总结就是,相同的语言就是文件传输的协议。
了解了 HTTP 协议的主要工作过程,那接下来就是它建立连接的过程了。就像我为你举的例子一样,对方的手机号码在 HTTP 协议就是 IP 地址和端口。
比如我为 HTTP 服务器指定的端口是 8090,我的 IP 地址是“192.168.0.100”,那我就可以通过浏览器使用“http://192.168.0.100:8090”进行访问。可以看到,在访问的时候,我手动指定了协议、IP 地址和端口。
所以“http.server“模块不仅可以提供 HTTP 协议,还是一个灵活指定 IP 和端口的 HTTP 服务端。这也就是说,http.server 模块运行后,能让浏览器访问到服务端。
由于客户端服务端都采用 HTTP 协议,那么服务端列出的文件目录会自动被浏览器翻译给客户端的用户,你也就能浏览器查看到服务器上的文件名称,并把服务器的文件下载到客户端的电脑上,这就是“http.server”模块能够实现下载的原理和过程了。
另外,还要提醒你,在文件下载时,一定要注意共享的安全性。因为那些没有用户认证功能的 HTTP 文件下载方案,其他人都可以通过 IP 地址和端口直接获取你电脑中的文件,由此造成信息泄漏。因此在共享完成后,你需要把服务端及时关闭。
不过由于“http.server”默认没有提供文件上传的功能,手动编写也需要比较复杂的代码逻辑,因此,我来通过另一个 Flask 模块,它能通过简单的代码实现文件上传。
如何实现文件的上传
虽然我们要利用最精简的代码来把文件上传到服务端,但是它也要比下载功能复杂得多,因为基于 HTTP 协议的上传,我们需要自行编写 HTML 页面,来提示用户怎么上传,怎么使用 POST 方法访问服务器,以及怎么指定上传后文件的保存位置。
根据Flask 模块的官方文档的上传代码,进行了精简,考虑到你目前对编程的理解还比较基础,所以我把用户验证和文件扩展名验证功能去掉后,得到了如下的代码。通过这段代码,可以实现基于 Python 的文件上传。
把代码放在文稿中,供你学习和参考。同时,再详细讲解上传的过程,以及用到的代码。
import os
from flask import Flask, request
app = Flask(__name__)
app.config['UPLOAD_FOLDER'] = os.getcwd()
html = '''
<!doctype html>
<title>Upload new File</title>
<h1>Upload new File</h1>
<form action="" method=post enctype=multipart/form-data>
<p><input type=file name=file>
<input type=submit value=Upload>
</form>
'''
@app.route('/', methods=['GET', 'POST'])
def upload_file():
if request.method == 'POST':
file = request.files['file']
filename = file.filename
file.save(os.path.join(app.config['UPLOAD_FOLDER'], filename))
return html
if __name__ == '__main__':
app.run(host='0.0.0.0', port=8090)
根据上传的常规流程,我把代码按照四个步骤来实现文件上传,这四个步骤分别是运行服务器、获得网页内容、上传文件、保存文件。这四个步骤就是我们上传文件的四个关卡,那接下来我们就一关一关过。
运行服务器
第一步是服务器的运行。Flask 是第三方函数库,因此需要用一行命令进行安装,安装后才能使用。命令如下:
pip3 install flask
Flask 要想正确运行,首先要对它进行初始化。所以我在代码第 2 行导入 Flask 后,紧接着就对它进行了初始化,并给初始化后的 Flask 取了个名字 App。这就意味着,在当前脚本下对 Flask 的操作都可以用过 app 对象来完成。
在代码第 4 行,我还给 App 对象增加了一个参数“UPLOAD_FOLDER”,这个参数用来指定上传的文件将会保存在哪一个目录中。
接下来,你就可以使用“app.run()”方法运行了。和下载使用的“http.server”是一样的,由于 Flask 也是作为 HTTP 服务端,所以在 Flask 运行时,也必须指定它运行的 IP 地址和端口。
在代码中我把 IP 地址指定为“0.0.0.0”可以让它监听服务器所有的 IP 地址,我把端口设置为“8090”端口,你可以通过这一端口访问到 Flask 服务端。
获得网页内容
了解完怎么运用 Flask 之后,再带你看一下我是怎么把服务器上的网页传输到浏览器的。
浏览器要想获得网页内容,必须要用户发起到服务器的 HTTP 请求。发起请求后,浏览器会得到服务器经过 HTTP 协议传送回来的网页源代码。当你使用服务器的正确 IP 和端口访问到 Flask 服务器后,会看到这样一个界面,如下:
这个网页内容对应的是第 7-14 行的代码,这段代码是把 HTML 语言赋值给变量 html,并通过 upload_file() 函数传递给浏览器。
你看到的网页内容,其实就是 html 变量中的 HTML 语言,它被浏览器接收后,会被浏览器解析,解析之后的结果就是你看到的网页。
所以编写这段 HTML 语言的目的,也就是让你可以通过浏览器的“选择文件”按钮弹出窗口,选择要上传的文件,并通过点击“upload”按钮上传。
把 HTML 语言的代码传递给浏览器的函数是 upload_file() 函数,它是通过这 5 行代码实现的:
@app.route('/', methods=['GET', 'POST'])
def upload_file():
if request.method == 'POST':
... ...
return html
在第一行中,我们使用的是函数的装饰器,它的作用是在不改变被装饰函数的内容的前提下,给函数增加新的功能,装饰器也是由函数实现的,它的语法格式是在装饰器前增加一个“@”符号。这里的装饰器“@app.route()”就是用来增加“upload_file()”函数功能的。
详细讲解一下装饰器的两个参数。
一个是“/”, 它的作用是请求 URL 的路径为“/”时,调用 upload_file() 函数;
另一个是“methods”,限制请求“/”的方式只能是“GET”和“POST”方式。
举个例子,你会更容易理解。比如用浏览器访问“http://127.0.0.1:8090/”,由于浏览器默认的请求方式是“GET”方式,请求的 URL 是“/”,那么 Flask 会自动调用“upload_file()”函数。在函数中,再次判断请求的方式,由于默认是“GET”方式,所以函数会返回 html 变量,也就是你看到的网页内容。
上传文件
在你掌握了浏览器加载 HTML 之后,我们接下来就需要学习上传文件的代码执行过程。 要想上传一个文件,需要先点击浏览器的“upload”按钮,它是“form 表单”的提交功能。
“form 表单”的作用是在你点击按钮后,把文件以指定的方式和数据类型上传到服务器。指定方式和数据类型都是采用表单的参数进行指定的,它们分别是 method 和 enctype 参数。
第一个参数是“method=post”,它指定了表单是通过“POST”方式访问服务器的。通常上传文件会采用 POST 方式,主要原因 GET 方式最大只允许使用 1024 个字节,而 POST 方式在理论没有大小限制,完全取决于服务端的设置和内存大小。
第二个参数是“enctype=multipart/form-data”。这个参数是专门用来存放容量较大的文件的,它会把文件放到“request.FILES”中。
当你点击“upload”按钮之后,文件就开始上传到服务器的内存中。那接下来就到了最后一步,把内存中的数据保存成文件。
保存文件
要把内存中的数据保存到文件,我们可以通过“upload_file”函数的这 5 行代码来实现。
def upload_file():
if request.method == 'POST':
file = request.files['file']
filename = file.filename
file.save(os.path.join(app.config['UPLOAD_FOLDER'], filename))
在这段代码的第二行,对请求方式进行了判断:
如果是“GET”方式,会直接返回网页;
如果是“POST”方式,才会对文件进行处理。
具体的处理过程是:
1. 先从“request.files”中取出上传到服务器的文件数据;
2. 再通过“file.filename”取得上传时使用的文件名;
3. 接着,通过 path.join() 函数将事先指定好的路径和文件名拼接组成当前目录下的文件名后;
4. 最后,通过 file.save() 函数将内存中的文件内容,保存到服务器的同名文件中。
小结
今天的核心内容就是这些,总结一下。今天这节,讲解了怎样使用 Python 的模块来实现最简单的文件上传和下载功能,这一功能在公司内进行跨操作系统的文件传输不但速度快,而且极为便捷。
在讲解文件上传下载的同时,我还给你讲解了两个库的使用,分别是 http.server 和 Flask 两个模块。其中 Flask 是 Python 中非常著名的 WEB 服务端模块,除了可以进行文件上传外,它还能作为 Web 服务器提供网页访问。
在文件的上传和下载场景下,我还给你介绍了两种请求 HTTP 服务器的方式,它们分别是 GET 和 POST 方式。
GET 方式一般用于获取服务器的信息,类似从服务器上查找数据;
POST 方式一般用于向服务器上传信息,类似向服务器写入。
对服务器的请求方式还有更新、删除、更改单个值等不同的方式,其中 GET、POST 是最常用的形式,日常应用中,所以只需要记住这两个请求方式即可。
最后,希望通过 Flask 库、HTTP 协议的请求方式、简单的表单及其实现它的 HTML 代码,能够让你对 HTTP 协议以及 WEB 服务器有初步的了解。
因为 Python 的高效便捷,一方面体现在可以通过简单的语法在一台电脑上实现提效,另一方面,它能够通过极少的代码开发出功能非常强大的 WEB 服务器,这对你在办公数据的集中管理和网页自动化管理上都会有非常有效的帮助。
思考题
留一道思考题。题目是:如果我想在 Flask 展示表单的页面中,展示当前目录下的所有文件,那要怎么修改 Flask 的代码呢?
使用Python实现跨操作系统的文件上传和下载功能是本文的核心内容。文章首先介绍了Python的优势,包括简单易用、跨操作系统适用范围广、传输速度快等特点。然后详细讲解了通过一行代码实现文件的浏览和下载,以及如何通过命令行运行模块和使用“http.server”模块提供HTTP服务。作者还介绍了HTTP协议的工作过程和建立连接的过程,以及提醒了在文件下载时需要注意共享的安全性。最后,作者提到了使用Flask模块可以实现文件上传的功能。整体来说,本文通过简洁清晰的语言和实际案例,帮助读者快速了解了如何利用Python实现跨操作系统的文件同步功能。文章内容涵盖了Flask模块、HTTP协议的请求方式、简单的表单及其实现的HTML代码等内容,为读者提供了初步了解HTTP协议和WEB服务器的机会。文章还提出了思考题,引发读者思考和讨论。