http项目笔记（多线程版微型http服务器）

最新推荐文章于 2024-05-24 09:35:42 发布

逆风的方向我在飞翔

最新推荐文章于 2024-05-24 09:35:42 发布

阅读量984

点赞数 1

分类专栏： linux 计算机网络

本文链接：https://blog.csdn.net/uagvdu/article/details/70283596

版权

linux 同时被 2 个专栏收录

31 篇文章 0 订阅

订阅专栏

计算机网络

15 篇文章 0 订阅

订阅专栏

源码： https://github.com/uagvdu/WebServer

Web服务器：一般指网站服务器，是指驻留于因特网上的某种计算机上的程序（即在网络上运行的local程序），可以向浏览器等Web客户端发送各种类型的数据。

http ：超文本传输协议：是一个基于请求与响应模式的，无状态的，应用层的协议

了解http协议：链接： HTTP协议详解（真的很经典）

协议特点;

1.支持C/S模式

2.简单快速：客户端向服务器请求服务时，只需传送请求方法和路径。HTTP协议简单，使得HTTP服务器的程序规模小，因而通信速度快

3. 灵活：HTTP允许传输任意数据类型的对象，正在传输的类型由Content-Type加以标记

4. 无连接：仅作用在应用层，底层使用的是TCP；每次连接只处理一个请求，服务器处理完客户的请求，并收到客户的应答后，就断开连接：请求->响应->断开

5. 无状态：HTTP协议是无状态协议，无状态是指协议对事物的处理没有记忆能力，即：缺少状态意味着如果后续处理需要前面的信息，则它必须重传，这样导致每次连接传送的数据量增大，反之，在服务器不需要先前信息时他的应答就比较快

URL：统一资源定位符：互联网上的每个文件都有一个唯一的URL ：链接：详解URL的组成

例如：http://host[":"port][abs_path][？参数]

http: 表示通过HTTP协议来定位网络资源

host；表示合法的Internet主机域名或者IP地址

prot：指定服务的端口号，为空则使用缺省端口80

abs_path:指定资源的URI（统一资源标识符）。

参数（可选):参数的存在决定了所访问的html网页是动态还是静态或者伪静态链接：静态、动态、伪静态的URL结构到底哪种更利于SEO

URL：一般由传输协议，域名，端口号，加具体的资源路径组成

若没有具体的资源路径，则在其尾部自动添加 \ 如：

http://www.sina.com.cn 浏览器会自动添加 \

http://www.sina.com.cn/

在我看来这个\ 就是目标主机的根目录，根目录后面跟的具体路径名就是资源的具体路径

从域名后的第一个“/”开始到最后一个“/”为止，是虚拟目录部分。虚拟目录也不是一个URL必须的部分。

HTTP之响应和 HTTP之请求：

HTTP消息由客户端到服务器的请求和服务器到客户端的响应组成。请求消息和响应消息都是由开始行（对于请求消息，开始行就是请求行，对于响应消息，开始行就是状态行），消息报头（可选），空行（只有CRLF的行），消息正文（可选）组成。

空行坚决不能少

注：此处的http服务器基于1.0版本的http协议，所以只有GET和POST方法

POST和GET方法区别：链接： HTTP 的GET和POST区别

请求参数的位置不同：Get的参数在URL上，而Post的参数在请求报文主体

传输数据长度限制：特定浏览器和服务器对URL的长度有限制，因此对于GET提交时，传输数据就会受到URL长度的限制。 POST:由于不是通过URL传值，理论上数据不受限。但实际各个WEB服务器会规定对post提交数据大小进行限制，Apache、IIS6都有各自的配置

安全性：post要比Get高，但也是在某一情况下的相对而言

POST和GET使用选择：

HTTP中的GET，POST，PUT，DELETE就对应着对这个资源的查，改，增，删4个操作。到这里，大家应该有个大概的了解了，GET一般用于获取/查询资源信息，而POST一般用于更新资源信息。

HTTP标准包含这两种方法是为了达到不同的目的。POST用于创建和更新资源，资源的内容会被编入HTTP请示的内容中。例如，处理订货表单、在数据库中加入新数据行等。

当请求无副作用时(如进行搜索)，便可使用GET方法;当请求有副作用时(如在数据库添加数据行)，则用POST方法。一个比较实际的问题是：GET方法可能会产生很长的URL，或许会超过某些浏览器与服务器对URL长度的限制。

CGI（通用网关接口）：

解释：

CGI是外部应用程序（CGI程序）与WEB服务器之间的接口标准，是在CGI程序和Web服务器之间传递信息的过程。CGI规范允许Web服务器执行外部程序，并将它们的输出发送给Web浏览器，CGI将Web的一组简单的静态超媒体文档变成一个完整的新的交互式媒体。

对一个 CGI 程序，做的工作其实只有：从环境变量(environment variables)和标准输入(standard input)中读取数据、处理数据、向标准输出(standard output)输出数据。环境变量中存储的叫 Request Meta-Variables，也就是诸如 QUERY_STRING、PATH_INFO 之类的东西，这些是由 Web Server 通过环境变量传递给 CGI 程序的，CGI 程序也是从环境变量中读取的。标准输入中存放的往往是用户通过 PUTS 或者 POST 提交的数据，这些数据也是由 Web Server 传过来的。

只要是提供HTML的服务器端程序都可以叫CGI，APS、PHP、JSP这些都是，你用C语言写一个可以提供HTML的服务器端EXE文件，也叫CGI，换句话说：CGI支持任何语言的编写

简而言之：CGI就是服务器的子进程执行web浏览器需要的功能

注： cgi规定只能以标准输入输出作为数据的导入导出

长连接，短连接：

长连接： Client方与Server方先建立通讯连接，连接建立后不断开，然后再进行报文发送和接收。

短连接： Client方与Server每进行一次报文收发交易时才进行通讯连接，交易完毕后立即断开连接。此种方式常用于一点对多点

通讯，比如多个Client连接一个Server. 即：请求->响应->断开

数据粘包：

----对于基于TCP开发的通讯程序,有个很重要的问题需要解决,就是封包和拆包.

TCP粘包是指发送方发送的n个数据包，不考虑丢失的情况，在接收方看来只接收了小于n个包的数据包

（*注：无法区分是因为数据在网络上传输的方式是以二进制进行传输）

粘包出现的原因：

发送端等缓冲区满的时候发送数据，造成粘包

接收端不能及时接收缓冲区的包，造成一次性多个包的接收

解决粘包的方法：

一是对于发送方引起的粘包现象，用户可通过编程设置来避免，TCP提供了强制数据立即传送的操作指令 push，TCP软件收到该操作指令后，就立即将本段数据发送出去，而不必等待发送缓冲区满；

二是对于接收方引起的粘包，则可通过优化程序设计、精简接收进程工作量、提高接收进程优先级等措施，使其及时接收数据，从而尽量避免出现粘包现象；

三是由接收方控制，将一包数据按结构字段，人为控制分多次接收，然后合并，通过这种手段来避免粘包。

以上提到的三种措施，都有其不足之处。第一种编程设置方法虽然可以避免发送方引起的粘包，但它关闭了优化算法，降低了网络发送效率，影响应用程序的性能，一般不建议使用。第二种方法只能减少出现粘包的可能性，但并不能完全避免粘包，当发送频率较高时，或由于网络突发可能使某个时间段数据包到达接收方较快，接收方还是有可能来不及接收，从而导致粘包。第三种方法虽然避免了粘包，但应用程序的效率较低，对实时应用的场合不适合.

逆风的方向我在飞翔

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
http项目笔记（多线程版微型http服务器）

源码：https://github.com/uagvdu/WebServer Web服务器：一般指网站服务器，是指驻留于因特网上的某种计算机上的程序（即在网络上运行的local程序），可以向浏览器等Web客户端发送各种类型的数据。 http ：超文本传输协议：是一个基于请求与响应模式的，无状态的，应用层的协议了解http协议：HTTP
复制链接

扫一扫