HTTP_Web服务器基础原理详解

什么是http协议

超文本传送协议 (HTTP-Hypertext transfer protocol) 定义了浏览器(即万维网客户进程)怎样向万维网服务器请求万维网文档,以及服务器怎样把文档传送给浏览器。从层次的角度看,HTTP是面向(transaction-oriented)应用层协议,它是万维网上能够可靠地交换文件(包括文本、声音、图像等各种多媒体文件)的重要基础。

什么是HTTP的事务(HTTP的工作流程)

一次HTTP操作称为一个事务,其工作过程可分为四步
1. 首先客户机与服务器需要建立连接。只要单击某个超级链接,HTTP的工作开始。
2. 建立连接后,客户机发送一个请求给服务器,请求方式的格式为:统一资源标识符(URL)、协议版本号,后边是MIME信息包括请求修饰符、客户机信息和可能的内容。
3. 服务器接到请求后,给予相应的响应信息,其格式为一个状态行,包括信息的协议版本号、一个成功或错误的代码,后边是MIME信息包括服务器信息、实体信息和可能的内容。
4. 客户端接收服务器所返回的信息通过浏览器显示在用户的显示屏上,然后客户机与服务器断开连接。

如果在以上过程中的某一步出现错误,那么产生错误的信息将返回到客户端,有显示屏输出。对于用户来说,这些过程是由HTTP自己完成的,用户只要用鼠标点击,等待信息显示就可以了。

HTTP协议永远都是客户端发起请求,服务器回送响应。
这样就限制了使用HTTP协议,无法实现在客户端没有发起请求的时候,服务器将消息推送给客户端。
HTTP协议是一个无状态的协议,同一个客户端的这次请求和上次请求是没有对应关系。

URL

统一资源定位符(URL,英语UniformResourceLocator的缩写)也被称为网页地址,是因特网上标准的资源的地址。
URL的格式由下列三部分组成:
第一部分是协议(或称为服务方式);
第二部分是存有该资源的主机IP地址(有时也包括端口号);
第三部分是主机资源的具体地址。,如目录和文件名等。
第一部分和第二部分之间用“://”符号隔开,第二部分和第三部分用“/”符号隔开。第一部分和第二部分是不可缺少的,第三部分有时可以省略。现在几乎所有的URI都是URL.

http请求的方式

GET 请求获取Request-URI所标识的资源
POST 在Request-URI所标识的资源后附加新的数据
HEAD 请求获取由Request-URI所标识的资源的响应消息报头
PUT 请求服务器存储一个资源,并用Request-URI作为其标识
DELETE 请求服务器删除Request-URI所标识的资源
TRACE 请求服务器回送收到的请求信息,主要用于测试或诊断
CONNECT 保留将来使用
OPTIONS 请求查询服务器的性能,或者查询与资源相关的选项和

http响应码信息(状态码)

2开头 (请求成功)表示成功处理了请求的状态代码

200 (成功) 服务器已成功处理了请求。 通常,这表示服务器提供了请求的网页。
201 (已创建) 请求成功并且服务器创建了新的资源。
202 (已接受) 服务器已接受请求,但尚未处理。
203 (非授权信息) 服务器已成功处理了请求,但返回的信息可能来自另一来源。
204 (无内容) 服务器成功处理了请求,但没有返回任何内容。
205 (重置内容) 服务器成功处理了请求,但没有返回任何内容。
206 (部分内容) 服务器成功处理了部分 GET 请求。

3开头 (请求被重定向)表示要完成请求,需要进一步操作。 通常,这些状态代码用来重定向

300 (多种选择) 针对请求,服务器可执行多种操作。 服务器可根据请求者 (user agent) 选择一项操作,或提供操作列表供请求者选择。
301 (永久移动) 请求的网页已永久移动到新位置。 服务器返回此响应(对 GET 或 HEAD 请求的响应)时,会自动将请求者转到新位置。
302 (临时移动) 服务器目前从不同位置的网页响应请求,但请求者应继续使用原有位置来进行以后的请求。
303 (查看其他位置) 请求者应当对不同的位置使用单独的 GET 请求来检索响应时,服务器返回此代码。
304 (未修改) 自从上次请求后,请求的网页未修改过。 服务器返回此响应时,不会返回网页内容。
305 (使用代理) 请求者只能使用代理访问请求的网页。 如果服务器返回此响应,还表示请求者应使用代理。
307 (临时重定向) 服务器目前从不同位置的网页响应请求,但请求者应继续使用原有位置来进行以后的请求。

4开头 (请求错误)这些状态代码表示请求可能出错,妨碍了服务器的处理

400 (错误请求) 服务器不理解请求的语法。
401 (未授权) 请求要求身份验证。 对于需要登录的网页,服务器可能返回此响应。
403 (禁止) 服务器拒绝请求。
404 (未找到) 服务器找不到请求的网页。
405 (方法禁用) 禁用请求中指定的方法。
406 (不接受) 无法使用请求的内容特性响应请求的网页。
407 (需要代理授权) 此状态代码与 401(未授权)类似,但指定请求者应当授权使用代理。
408 (请求超时) 服务器等候请求时发生超时。
409 (冲突) 服务器在完成请求时发生冲突。 服务器必须在响应中包含有关冲突的信息。
410 (已删除) 如果请求的资源已永久删除,服务器就会返回此响应。
411 (需要有效长度) 服务器不接受不含有效内容长度标头字段的请求。
412 (未满足前提条件) 服务器未满足请求者在请求中设置的其中一个前提条件。
413 (请求实体过大) 服务器无法处理请求,因为请求实体过大,超出服务器的处理能力。
414 (请求的 URI 过长) 请求的 URI(通常为网址)过长,服务器无法处理。
415 (不支持的媒体类型) 请求的格式不受请求页面的支持。
416 (请求范围不符合要求) 如果页面无法提供请求的范围,则服务器会返回此状态代码。
417 (未满足期望值) 服务器未满足”期望”请求标头字段的要求。

5开头(服务器错误)这些状态代码表示服务器在尝试处理请求时发生内部错误。 这些错误可能是服务器本身的错误,而不是请求出错

500 (服务器内部错误) 服务器遇到错误,无法完成请求。
501 (尚未实施) 服务器不具备完成请求的功能。 例如,服务器无法识别请求方法时可能会返回此代码。
502 (错误网关) 服务器作为网关或代理,从上游服务器收到无效响应。
503 (服务不可用) 服务器目前无法使用(由于超载或停机维护)。 通常,这只是暂时状态。
504 (网关超时) 服务器作为网关或代理,但是没有及时从上游服务器收到请求。
505 (HTTP 版本不受支持) 服务器不支持请求中所用的 HTTP 协议版本。
http协议的特点
HTTP协议的主要特点可概括如下:
1.支持客户/服务器模式。
2.简单快速:客户向服务器请求服务时,只需传送请求方法和路径。请求方法常用的有GET、HEAD、POST。每种方法规定了客户与服务器联系的类型不同。由于HTTP协议简单,使得HTTP服务器的程序规模小,因而通信速度很快。
3.灵活:HTTP允许传输任意类型的数据对象。正在传输的类型由Content-Type加以标记。
4.无连接:无连接的含义是限制每次连接只处理一个请求。服务器处理完客户的请求,并收到客户的应答后,即断开连接。采用这种方式可以节省传输时间。
5.无状态:HTTP协议是无状态协议。无状态是指协议对于事务处理没有记忆能力。缺少状态意味着如果后续处理需要前面的信息,则它必须重传,这样可能导致每次连接传送的数据量增大。另一方面,在服务器不需要先前信息时它的应答就较快。
http1.0和1.1区别
HTTP/1.0 每次请求都需要建立新的TCP连接,连接不能复用。优化的话,需要在请求头里保持长连接(keep-alive)。
HTTP/1.1 新的请求可以在上次请求建立的TCP连接之上发送,连接可以复用。优点是减少重复进行TCP三次握手的开销,提高效率。不需要添加长连接,默认就有。
缺点:在同一个TCP链接中,新的请求需要等上次请求收到响应后,才能发送。
HTTP1.1在Request消息头里头多了一个Host域, HTTP1.0则没有这个域。 Host: www.w3.org
HTTP1.1增加了OPTIONS, PUT, DELETE, TRACE, CONNECT这些Request方法.

apache工作模式详解

作为web服务器,apache的主要作用就是接受并响应用户请求,显示给用户所访问的资源。那么当许多个用户同时来访问,apache该如何作出回应呢,mpm就是解决这个问题的。

一,MPM介绍

mpm(Multi Path Model),即多道处理模块,apache的核心,它有三种类型:prefork、worker、event,分别代表三种不同的响应方法。

1,prefork
这是apache默认的工作模式,它事先启动很多进程,并接受用户请求的,在众多的进程中,有一个进程的属主组是root.root 其它的都是apache.apache,因为在linux中,启动1024以下的端口只有管理员才有权限,因此只有管理员才能启动80端口。
这个进程并不负责响应用户请求,它专门负责创建空闲进程来响应请求,或者销毁多余的空闲进程。所以它是主导进程,称为 master process,其它的称为worker process
它预先生成进程。一个请求用一个进程响应,好处是稳定可靠,一个进程崩溃了不会影响其它进程。但是性能差,一个用户一个进程,并发量的时候,资源消耗量很多,而且大量进程的切换,会影响响应时间。
2,worker
基于线程,一个进程生成多个线程响应用户请求,只有一个进程。apache启动后,生成多个进程(此进程不是用来响应用户请求的),而是每个进程生成多个线程来响应用户请求,用一个线程来响应一个用户请求(是用线程来响应用户请求 的)
由于多线程共享同一个进程的资源,如果同一进程 下的线程曾经访问过一个页面并且打开过,第二个线程访问的时候不用再打开了,直接访问到了,这样看起来效率比较高,,但是 多个线程共享资源的时候,如果要写一个资源的话,会导致资源争用的,所以为了避免资源争用,必须要实现资源加锁,因此,如果不能良好的解决锁竞争的话,线程是不是比进程效率更高这很难说的清楚,尤其是linux不是原生态支持线程的,所以worker模型经测试发现,在linux上它还不如prefork模型性能好,这是就为什么默认使用perfork而不是worker模型的原因。
3,event
基于事件,一个进程处理多个用户请求,不是用线程来响应的,直接一个进程同时处理多个请求。nginx也是采用这种工作模式

在apache配置文件中,一些关于perfork的指令:

minspareserver: :最小空闲进程。

maxspareserver:最大空闲进程。

ServerLimit :为限定maxclients的值 //此值默认不在apache2.conf里,需要手动添加,默认为256

maxclients:最大值不能超过serverlimit的值

要想把maxclients值调更大,得先调serverlimit:,怎么调这个值:把服务停掉,把所有进程kill掉,再启动就可以了,而不是,把它值改掉,重启服务是不会生效的。

maxrequestsPerchild :4000 一个进程最多响应多少次请求,意思是说,一个进程响应完用户请求后,应该被杀死的,但是刚响应完,别一个用户的请求进来了,那它就接着响应,如此物质循环,最多响应4000次

达到了4000,无论如何要把你kill掉,0表示不做限定。

worker:

startserver 2 开始启动2 个进程。

ThreadsPerChild 25:每个进程可以生成25个线程

  • 1
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值