如何理解 Python Web 开发?

因为 python代码的优雅美观且易于维护这一特点,越来越多的人选择使用Python做Web开发。而Python的Web框架百花齐放,目前比较流行的框架有大包大揽的Django,小巧灵活的Flask、Bottle,还有性能高效的异步框架Tornado、sanic。这么多框架只要选择一个,阅读他的文档,就可以很轻松的搭建一个web app,完全不需要去管他实现的原理。

本篇文章意在对一个web开发做一个梳理。

前端网页三剑客

我们打开浏览器输入一个网址 yukunweb.com,然后就看到了浏览器给我们显示的页面,这个时候打开浏览器开发者工具,点击Network,刷新页面,会看到下方的请求的url,点击Response,就可以看到服务器返回给浏览器的html文件信息了。如果复制Response响应的内容,保存为index.html并且在浏览器打开,依然可以看到首页的内容,但是似乎缺少了一些页面的样式和功能。

这是因为当浏览器接收到首页的 HTML源码后,它会根据HTML的规则去显示页面,然后再根据HTML里的链接,自动发送HTTP请求给服务器,拿到相应的图片,和JavaScript、CSS等资源,最终显示出一个完整的页面。所以我们会在Network下面能看到很多额外的以.js,.css等后缀的请求了。

其实我们看到的页面就是浏览器按照 HTML的规则,展示给我们的。HTML告诉浏览器那里是导航,那里是主栏,那里是侧栏。而这些信息如何显示,或者是显示的样式,就是CSS文件的功劳。至于比如导航的下拉隐藏上拉显示就是JavaScript的作用。

如果想要做Web开发,就一定得熟悉 HTML、CSS、JavaScript三剑客的知识,这里推荐W3school的前端教程,也是我学习前端的地方:W3school

客户端和服务器通信

理解了前段三剑客,就知道如何去写一个网页。那么从我们在浏览器的地址栏输入 URL,到Web页面呈现出来到底经历了什么。

如图,一般这种通过发送请求获取服务器资源的Web浏览器,都可以称为客户端(client)。首先发送一个请求(request)给服务器,大多是以GET请求方式访问,服务器接收到你的请求,然后取到请求的资源,返回给客户端。

服务器和客户端之间交流是怎么进行的呢,服务器是怎么理解客户端的请求的呢。这里就需要一种协议规范,就是HTTP(HyperText Transfer Protocol,超文本传输协议)。可以说, Web是建立在HTTP协议上通信的。

如图,仍然是之前的例子,打开浏览器访问 yukunweb.com,打开浏览器开发者工具,点击图中标记的选项卡(记得点view parsed),可以看到客户端发给服务器的请求头前两行。

GET / HTTP/1.1

Host: www.yukunweb.com

第一行开头的GET表示请求访问服务器的类型,称为方法(method)。随后的字符 /指明了请求访问的资源对象,即请求URI。最后的HTTP/1.1,即HTTP的版本号,用来提示客户端使用的HTTP协议功能。

综上所述,第一行请求内容的意思是:请求访问某台 HTTP服务器上的/(首页)页面资源。所以第二行的Host表示请求的域名也就是服务器所在地址。想学习可以加Python学习(q-u-n )(227-435-450)即可获取,内附:开发工具和安装包,以及视频资料系统学习路线图

如图,如果是 POST请求的话,不仅会有请求头部信息,还有一个Form Data的请求实体内容。

接收到请求的服务器呢,他会将请求内容的处理结果以响应的形式返回,看图中的第一行:

开头的部分仍然是服务器对应的 HTTP版本,紧接着的200 OK表示请求的处理结果的状态码 (status code) 和原因短语。200状态码就表示响应成功,常见的404表示访问错误,500表示服务器响应错误。这里的OK是没有固定的规则的,你也可以让他返回GOOD啥的。

下一行是服务器信息,本站用的是 Nginx服务器,在下一行显示了创建响应的日期时间。在下一行的Content-Type表示内容的类型,客户端会依赖他判断响应的内容是网页还是音频,图片等类型。

这里只是简单的介绍了 HTTP协议,即是客户端与服务器之间的通信协议。如果想要深入了解推荐阅读《HTTP权威指南》。

WSGI

如果你浏览一个地址 http://www.yukunweb.com/search-result/?keywords=音乐,你会访问到本站的音乐关键词的搜索结果。我们知道客户端发送请求给服务器,那么服务器是怎么拿到资源的呢。其实这是交给后端运行的应用返回的,好比你抓取一个页面到获取到信息,这些逻辑的处理肯定是我们的程序再跑。

但是,接收并且解析客户端的 HTTP请求在发送HTTP响应这些底层操作,后端的程序肯定是不会去处理的。所以,要想只专注于Web业务逻辑,还需要一个服务器和web应用之间的嫁接层————WSGI。

什么是WSGI(Web Server Gateway Interface)?

WSGI翻译过来就是Web服务器网关接口。他只是一个规范,定义了Web服务器如何与Python应用程序进行交互,使得使用Python写的Web应用程序可以和Web服务器(nginx/apache)对接起来。

该规范的地址:PEP 333

WSGI是Python的Web开发的基石,有了它你就有了一切,它存在的目的有两个:

描述 Web 服务器如何与 Web 应用程序交互(将客户端请求传给应用程序),

描述 Web 应用程序如何处理请求和如何返回数据给服务器。

由于 Python内置的标准库里有一个WSGI库wsgiref,我们基于他来写一个体现WSGI目的的例子:

from wsgiref.simple_server import make_server

def application(environ, start_response):

status = '200 OK'

response_headers = [('Content-type', 'text/html')]

start_response(status, response_headers)

body = 'Hello, {name} !!!'.format(name=environ['PATH_INFO'][1:] or 'WSGI')

return [body.encode('utf-8')]

app = make_server('', 8000, application)

app.serve_forever

运行程序,如果没有报错,此时打开浏览器输入地址 127.0.0.1:8000和127.0.0.1:8000/GuTianle,就可以看到程序返回的页面了。如图:

我们可以看到一个请求,他的入口只需要一个 WSGI的处理函数。因为所有的请求信息都包含在environ中,这样我们就可以根据这些信息去返回不同的数据。

参数:

environ:字典类型,存放了所有和客户端相关的信息。如果想知道他里面有哪些参数,可以更改上面的代码在 return 行上面加一个 for k, v in environ.items的循环,打印出字典里的所有参数。

startresponse:一个可调用对象,接收两个必选参数和一个可选参数:

status: 一个字符串,表示 HTTP 响应状态字符串,如 200,404

responseheaders: 一个列表,包含有如下形式的元组:(headername, headervalue),用来表示 HTTP 响应的 headers ,如('Content-type', 'text/html')

exc_info(可选): 用于出错时,服务器需要返回给浏览器的信息

返回:一个可迭代对象, 服务器通过遍历这个可迭代对象可以获得body的全部内容,内容可以是 html也可以是json。

这里简单的介绍了 WSGI是什么,干什么。如果理解了WSGI,那么写一个Python的Web框架就很简单了。这也是为什么Python有成百上千web框架的原因。

实现基于WSGI的框架

上面我们理解了 WSGI是干什么的,那么我们基于它实现一个简单的web框架可以说轻而易举了。

from wsgiref.simple_server import make_server

class Application(object):

def __init__(self, environ, start_response):

self.start_response = start_response

self.path = environ['PATH_INFO']

def __iter__(self):

if self.path == '/':

status = '200 OK'

response_headers = [('Content-type', 'text/html')]

self.start_response(status, esponse_headers)

yield 'Hello,World!'.encode('utf-8')

elif self.path == '/wsgi':

status = '200 OK'

response_headers = [('Content-type', 'text/html')]

self.start_response(status, response_headers)

yield 'Hello,WSGI!'.encode('utf-8')

else:

status = '404 NOT FOUND'

response_headers = [('Content-type', 'text/html')]

self.start_response(status, response_headers)

yield '404 NOT FOUND'.encode('utf-8')

if __name__ == "__main__":

app = make_server('127.0.0.1', 8000, Application)

print('Serving HTTP on port 8000...')

app.serve_forever

这个 Application类只不过是对WSGI又做了一层简单的封装而已,由于上面说过WSGI函数返回的是一个可以迭代对象,所以需要实现一个iter方法,里面控制了客户端的请求路由并且返回不同的输出。

当然如果你想扩展成一个像样的框架还需要考虑很多,比如像 flask那样方便的路由系统,还有对于用户请求方式的处理等等。总之是个很需要折腾的过程,好比flask的0.1版本去掉注释也就 200 多行,而如今最新版本。。。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值