基于python 自己动手写一个简单的web服务器

最新推荐文章于 2024-05-06 10:32:49 发布

小乖多想c

最新推荐文章于 2024-05-06 10:32:49 发布

阅读量6.2k

点赞数 6

分类专栏： python 文章标签： python http web服务器

本文链接：https://blog.csdn.net/weixin_44485643/article/details/87807191

版权

python 专栏收录该内容

7 篇文章 0 订阅

订阅专栏

1. 前言

如今一提到服务器首先就想到 apache tomcat nginx等。虽然这些服务器很优秀。但是对于我们平时拿来练手的一些小项目来说却是大材小用，杀鸡用牛刀，而且上述主流服务器配置起来也略嫌麻烦。俗话说自己动手丰衣足食，今天我们就来实现一个简单的静态web服务器。

2. http协议

谈到浏览器，服务器时，作为计算机爱好者，首先想到的就是www、http、https、html等等，那我们就先来了解一下http协议。

超文本传输协议（HTTP，HyperText Transfer Protocol)是互联网上应用最为广泛的一种网络协议。http协议是一个基于tcp的应用层协议，

简单来说当我们在浏览器里输入一个网址访问网页时，就是在使用http协议，比如我们访问 baidu ，当你在浏览器里输入 ‘www.baidu.com’ 后按下回车时，浏览器会自动判断并补全协议如下图(此处不深究)
在这里插入图片描述

那么问题来了，当我们输入www.baidu.com 时浏览器向百度的服务器发送了什么内容呢? 接下来我们借助 “网络调试助手” 来模拟一次浏览器向服务器请求和服务器应答的过程。

网络调试助手基本配置如下图：
在这里插入图片描述

我在这里选择了127.0.0.1本机回环地址，端口8080 为大家演示

配置好后点击连接。
然后打开浏览器输入 http://127.0.0.1:8080

我们看到小圈圈在转，说明正在请求
回到网络调试助手，发现在网络数据接受区出现如下内容

4.紧接着我们在发送区输入 HTTP/1.1 200 OK 回车，空一行后继续输入HelloWorld 点击发送,点击断开，然后返回浏览器，发现小圈圈停止了转动，并在页面显示出了HelloWorld

在这里插入图片描述

在这里插入图片描述
5.这就是浏览器也与服务器之间一次简单的请求，应答

一、 http协议请求部分

我们在浏览器打开调试器，重复上述操作，得到如下结果

在这里插入图片描述

在这里插入图片描述
对比上述红色部分不难看出他们是相同的，而在网络调试助手中的第一句 GET / HTTP/1.1在这三部分中我们也可以在浏览器的调试器中找到类似的。

如GET 对应 请求方法：GET，
‘/’ 对应状态代码中最后的 ‘/’ ，以及请求url中最后的‘/’。/ 在这里代表的是访问html在服务器中的路径
最后的HTTP/1.1则是HTTP的版本号，比如现在我们使用的就是第1.1个版本

在http协议的请求中： 请求方法路径版本号 是构成协议的最基本的，最简单的也是必须要有的三部分

观察网络调试助手中收到的信息，除了 GET / HTTP/1.1 之外还有一堆东西是怎么来的呢有什么用呢？

其实，剩下的这部分是浏览器根据自身的情况自动生成的，如：

User-Agent：xxxxxxxxxxxx 这代表访问当前页面使用的浏览器是哪个，以及此浏览器的内核信息等。
Accept-Language：xxxxxxx 请求头允许客户端声明它可以理解的自然语言，简单说就是浏览器可以识别的语言。

其余的这里就不一一介绍了，但我们可以发现一个规律，就是剩下的这部分都是以 “xxx : xxx” 格式存在的。其实这也是http协议所规定的。

现在我们就可以完整的得出http协议在请求时的格式规定：

第一行必须是 请求方法路径版本号
其余信息皆以 xxx : xxx 的格式各占一行

二、 http协议响应部分

明白了请求我们接着看看服务器是如何响应浏览器的请求，又是发送了哪些数据给浏览器呢？

之前使用网络调试助手模拟应答时，在发送框内输入了 HTTP/1.1 200 OK 回车空行后又输入HelloWorld ，但是浏览器却只显示了HelloWorld，那么HTTP/1.1 200 OK 去哪里了呢，参考之前的请求协议不难得出结论，HTTP/1.1 200 OK 是响应头的一部分，而响应头浏览器是不会显示的，浏览器只会显示正文。

那么接下来我们就来看看响应头格式以及正文格式：

HTTP/1.1 200 OK 不难看出这也是一个三段式: 这三段分别是 版本号状态码状态短语
如果还有其余部分控制信息则以 xxx ：xxx 格式各占一行
正文与响应头之间要空一行，当浏览器在响应头后发现空行后，则将空行后的内容都当作正文进行显示处理

这里给出访问百度时，百度服务器给我们的响应头部信息
在这里插入图片描述

3.用python来实现http协议原理

在python中要想实现网络通讯，都离不开socket（套接字）模块，那么我们就先来认识下socket模块的基本使用 (由于之前也提到过http协议是基于tcp的上层协议，所以此处主要介绍socket的tcp server的使用)

导入socket
import socket
创建socket对象
udp_sock= socket.socket(socket.AF_INET,socket.SOCK_DGRAM) # 创建一个基于udp协议的socket
tcp_sock= socket.socket(socket.AF_INET,socket.SOCK_STREAM) # 创建一个基于tcp协议的socket
给套接字绑定ip以及端口
localaddr = ('',8080) # ip与端口以元组的形式存在，如果绑定的ip是本地ip则可以用 '' 来代替
tcp_sock.bind(localaddr) # 绑定信息，参数为一个元组
设置套接字为监听状态
tcp_sock.listen(128) # 参数128 代表可建立socket连接的最大个数 windows，mac 此连接参数有效 Linux 此连接参数无效，默认最大所以这就是很多http服务器需用linux系统的原因~
设置套接字阻塞，等待客户端连接
new_client,client_addr = tcp_sock.accept() # accept()方法返回值为一个列表，利用python中的拆包机制，我们可以将此列表中的元素取出，第一个为新连接客户端的socet，第二个为此客户端的ip以及端口等信息
接收数据
recv_data = new_client.recv(1024) # 从新连接的客户端socket那儿接收客户端(浏览器发送来的数据)

以上就是一些基本使用方法，还有一些我们在代码中在详细介绍

下面来详细介绍下tcp socket为客户端服务的过程，首先我们来看一张图片
在这里插入图片描述
当我们在服务器上创建一个tcp型套接字并且绑定IP及端口等信息并且设置为监听模式，设置阻塞后，tcp_sock 就处于等待客户端连接的状态。这时，若有浏览器向服务器发出请求，这个请求将被tcp_sock 接受到，接受到后，并不是tcp_sock这个端口负责与浏览器通讯，而是操作系统将重新创建一个socket并且分配一个随机的空闲端口负责与浏览器经行数据的收发。例如如图中浏览器1向服务器发送消息，此时tcp_sock接受到后会交给new_client1负责处理，而new_client1则会向浏览器1响应之前浏览器发向tcp_sock的请求，由此，一条新的通讯链路便在服务器与浏览器之间建立起来。

这个过程就向我们平时打电话给10086人工客服一样，首先，你拨通的号码是10086，但10086并不负责与你交流，而是根据你输入的数字随机分配一名客服与你交流一样。

4.代码实现

import socket
import re

def service(new_client):
 '''为新连接的客户端提供服务'''
 
 # 1.接受客户端的请求
 request = new_client.recv(1024).decode('utf8')
 request_lines = request.splitlines()
 print()
 print('-'*20)
 print(request)
 print('-'*20)
 print()
 
 # 2.判断出客户端访问的页面
 pat = '.* (/.*) '
 res = re.match(pat,request_lines[0])
 if res:
  path = res.group(1)
 else:
  path = 'notfount.html'
  
 # 3.读取客户端请求的数据 
 if path == '/':
  path = '/index.html'
 try:
  f = open('./staic'+path,'rb')
 except Exception:
  html_content = 'HTTP/1.1 404 NOT FOUND\r\n'
  html_content += '\r\n'
  html_body = '404 NOT FOUND'
 else:
  html_content = 'HTTP/1.1 200 OK\r\n'
  html_content += '\r\n'
  html_body = f.read()
  f.close()
  
 # 4.发送数据给客户端
 new_client.send(html_content.encode('utf8'))
 new_client.send(html_body)
 
 # 5.关闭t客户端套接字
 new_client.close()

def main():
 '''http 服务器j控制流程''' 
 
 print('————————start working————————')
 print()
 
 # 1.创建套接字
 tcp_socket = socket.socket(socket.AF_INET,socket.SOCK_STREAM)
 
 # 当服务器先调用close()时，可以保证在 c四次挥手后立刻释放资源，这样就h可以保证下次运行时，端口等资源不会被占用
 tcp_socket.setsockopt(socket.SOL_SOCKET,socket.SO_REUSEADDR,1) 
 
 # 2.绑定本地信息
 localaddr = ('',8080)
 tcp_socket.bind(localaddr)
 
 # 3.设置为监听状态
 tcp_socket.listen(128)
 while True:
   # 4.将套接字阻塞，等待链接
   new_client,client_addr = tcp_socket.accept()
   
   # 5.为客户端服务
   service(new_client)
   
 # 6.关闭套接字
 tcp_socket.close()

if __name__ == '__main__':
 main()

5.代码运行及注意事项

一、 注意事项

1.代码必须和一个名为static的文件夹在同一目录下
2.static文件夹中存放要访问的html css js jpg等静态文件
3.主页index.html必须要存在
（以上要求可以修改代码中的路径而自定义）在这里插入图片描述

一、 运行程序

1.在当前路径下执行程序

在这里插入图片描述
2.打开浏览器在地址栏输入127.0.0.1:8080 后回车

在这里插入图片描述
3.观察命令窗口运行的结果
可见浏览器向服务器发送的最后两条请求时音乐和图片

在这里插入图片描述

6.结语

至此我们已经实现了一个简单的单任务静态的web服务器，可以用它来运行一些小项目。但是这并不完美，很显然单任务时一种效率低下的方式，服务器同一时间只能为一个客户端进行服务。那么如何实现并发，并行执行呢，请期待下篇博客。谢谢浏览，如有不足之处请及时指出。

小乖多想c

关注

6
点赞
踩
48

收藏

觉得还不错? 一键收藏
5
评论
基于python 自己动手写一个简单的web服务器

1. 前言如今一提到服务器首先就想到 apache tomcat nginx等。虽然这些服务器很优秀。但是对于我们平时拿来练手的一些小项目来说却是大材小用，杀鸡用牛刀，而且上述主流服务器配置起来也略嫌麻烦。俗话说自己动手丰衣足食，今天我们就来实现一个简单的静态web服务器。2. http协议谈到浏览器，服务器时，作为计算机行业从业者，首先想到的就是www、http、https、html等等，...
复制链接

扫一扫