python 实现简单的web服务器
1.实验要求
能够接受传入的 HTTP 连接请求并正确解析; 能够正确的响应并回送一个示例 HTML 网页;
要求解析:要搭建简单的web服务器,首先要对网络协议进行一定的了解,现阶段使用的HTTP协议就是本次完成实验需要突破的重点。
2.实验原理
HTTP协议定义Web客户端如何从Web服务器请求Web页面,以及服务器如何把Web页面传送给客户端。HTTP协议采用了请求/响应模型。客户端向服务器发送一个请求报文,请求报文包含请求的方法、URL、协议版本、请求头部和请求数据。服务器以一个状态行作为响应,响应的内容包括协议的版本、成功或者错误代码、服务器信息、响应头部和响应数据。
以下是 HTTP 请求/响应的步骤:
-
客户端连接到Web服务器
一个HTTP客户端,通常是浏览器,与Web服务器的HTTP端口建立一个TCP套接字连接。 -
发送HTTP请求
通过TCP套接字,客户端向Web服务器发送一个文本的请求报文,一个请求报文由请求行、请求头部、空行和请求数据4部分组成。 -
服务器接受请求并返回HTTP响应
Web服务器解析请求,定位请求资源。服务器将资源复本写到TCP套接字,由客户端读取。一个响应由状态行、响应头部、空行和响应数据4部分组成。 -
释放连接TCP连接
若connection 模式为close,则服务器主动关闭TCP连接,客户端被动关闭连接,释放TCP连接;若connection 模式为keepalive,则该连接会保持一段时间,在该时间内可以继续接收请求; -
客户端浏览器解析HTML内容
客户端浏览器首先解析状态行,查看表明请求是否成功的状态代码。然后解析每一个响应头,响应头告知以下为若干字节的HTML文档和文档的字符集。客户端浏览器读取响应数据HTML,根据HTML的语法对其进行格式化,并在浏览器窗口中显示。
服务器端响应流程
3.代码实现
(1)主函数
def main():
"""整体控制"""
tcpserver = socket.socket(socket.AF_INET,socket.SOCK_STREAM)
tcpserver.setsockopt(socket.SOL_SOCKET,socket.SO_REUSEADDR,1)
tcpserver.bind(("127.0.0.1", 7890))
tcpserver.listen(128)
while True:
newsocket, client_addr = tcpserver.accept()
service_client(newsocket)
tcpserver.close()
主函数用来实现服务器的整体运行流程,包括了套接字的创建,绑定本机IP地址,设置端口号为“7890”,对指定窗口的监听,等待客户端的连接,客户端连接成功后为该客户端提供服务,由于为客户端提供服务的过程较为复杂,故将所有服务操作另行放置在一个服务器响应函数中,主函数仅对该函数进行调用,使主函数结构简介,逻辑清晰。
(2)服务器具体响应函数——service_client()
通过对多个网页浏览器请求内容的观察,不难发现,request 的内容往往每一行的含义是不同的,所以第一步通过socket获取了浏览器的请求之后,要进行请求信息的处理,按行进行存储,便于后续有用信息的提取
request = newsocket.recv(1024).decode("utf-8")
request_lines = request.splitlines()
一般来说,请求信息的第一行就包含了所需要的HTML文件名,这里利用python的正则表达式对请求信息的第一行进行字符串匹配,最后获取的即为服务器需要返回的文件名。
filename = ""
ret = re.match(r"[^/]+(/[^ ]*)", request_lines[0])
从请求信息中提取文件名会出现多种情况,当浏览器仅仅访问端口,并未请求具体HTML文件时,浏览器自动返回默认网页;当浏览器请求的HTML文件服务器端拥有时,返回该网页;当浏览器请求的HTML文件服务器中不存在时,返回404,表示网页不存在。在这里要注意的是,打开文件是一件很危险的操作,故采用了try-except-else的框架,仅在文件存在时,才对文件进行读取以及返回操作。
if ret:
filename = ret.group(1)
if filename == "/":
filename = "/default.html"
try:
f = open("."+filename, "rb")
except:
response = "HTTP/1.1 404 NOT FOUND\r\n "
response += "\r\n"
response += "file not found!!!!"
newsocket.send(response.encode("utf-8"))
else:
html_content = f.read()
f.close()
# 返回http格式的数据给浏览器
response = "HTTP/1.1 200 OK\r\n"
response += "\r\n"
newsocket.send(response.encode("utf-8"))
newsocket.send(html_content)
4.实验结果
返回简单的默认HTML页面
返回指定的HTML页面
当请求页面不存在时