python3web库_基于 Python3 写的极简版 webserver

最新推荐文章于 2021-01-29 00:37:33 发布

weixin_39579127

最新推荐文章于 2021-01-29 00:37:33 发布

阅读量306

点赞数

文章标签： python3web库

基于 Python3 写的极简版 webserver。用于学习 HTTP协议，及 WEB服务器工作原理。笔者对 WEB服务器的工作原理理解的比较粗浅，仅是基于个人的理解来写的，存在很多不足和漏洞，目的在于给大家提供一个写 webserver 的思路。项目GitHub地址：https://github.com/hanrenguang/simple-webserver。

WEB服务器原理

学过计网的同学应该都知道 HTTP协议是在 TCP协议之上实现的。浏览器与服务器之间的通信首先是建立 TCP 连接，再进行请求和响应报文的传输。服务器是属于被动的一方，当浏览器发起请求的时候，服务器才能和浏览器通信，在此之前，服务器都处于一个等待监听的状态。

socket连接

实现服务器的第一步是建立一个 socket 连接，socket 套接字是对 TCP/UDP协议的一个封装，Python 就自带有 socket 模块，所以使用起来很方便。

import socket

sk = socket.socket(

socket.AF_INET,

socket.SOCK_STREAM

)

# 监听本地 8888 端口

host = '127.0.0.1'

port = 8888

sk.bind((host, port))

sk.listen(5)

while True:

try:

clientSk, addr = sk.accept()

print("address is: %s" % str(addr))

req = clientSk.recv(1024)

clientSk.sendall('...')

clientSk.close()

except Exception as err:

print(err)

clientSk.close()

这是一个极简的 socket-server，需要注意的是，我们仅实现了 TCP协议的部分。

解析HTTP请求

拿到浏览器的请求很简单，clientSk.recv() 即可获取请求报文，而些数据我们无法直接拿来用，因为它是基于 HTTP协议封装的数据，在我们进行下一步操作前，需要对请求报文“解封”。而在此之前，我们需要了解请求报文的格式。最快捷的方式呢，是打开浏览器(以 chrome 为例)，随便打开百度啥的，F12 打开开发者工具，在 Network 一栏就可以观察到。大概长下面这样：

GET / HTTP/1.1

Host: xxx

Connection: xxx

Cache-Control: xxx

Upgrade-Insecure-Requests: xxx

User-Agent: xxx

Accept: xxx

Accept-Encoding: xxx

Accept-Language: xxx

Cookie: xxx

我们把关注点放在第一行，GET 方法，请求的资源路径为 /，使用的协议是 HTTP1.1，之后就是一回车换行符 \r\n。所以我们对报文的解析如下(存在许多不足之处)：

# 第一步先对数据进行解码 decode()，