目录
5.MIME——Multipurpose Internet Mail Extensions 多用途互联网邮件扩展
11.1.3.1.1通用首部——请求报文和响应报文两方都会使用的首部
11.1.3.1.2请求首部——从客户端向服务器端发送请求报文时使用的首部
11.1.3.1.3响应首部——从服务器端向客户端返回响应报文时使用的首部
11.1.3.1.4实体首部——针对请求报文和响应报文的实体部分使用的首部
2.5MPM(multi-processing module )工作模式
2.5.3Event模型——事件驱动模型(worker模型的变种)
4.7MPM(Multi-Processing Module )多路处理模块
6.httpd运行MPM模式 prefork worker event
引言——Internet起源
因特网是"Internet”的中文译名,它起源于美国的五角大楼,它的前身是美国国防部高级研究计划局 (ARPA)主持研制的ARPAnet。20世纪50年代末,正处于冷战时期。当时美国军方为了自己的计算机 网络在受到袭击时,即使部分网络被摧毁,其余部分仍能保持通信联系,便由美国国防部的高级研究计划 局(ARPA)建设了一个军用网,叫做"阿帕网”(ARPAnet)。阿帕网于1969年正式启用,当时仅连接了 4台计算机,供科学家们进行计算机联网实验用,这就是因特网的前身。 到70年代,ARPAnet已经有了好几十个计算机网络,但是每个网络只能在网络内部的计算机之间互联通信,不同计算机网络之间仍然不能互通。为此, ARPA又设立了新的研究项目,支持学术界和工业界进行有关的研究,研究的主要内容就是想用一种新的方法将不同的计算机局域网互联,形成"互联网”。研 究人员称之为"internetwork”,简称"Internet” 在研究实现互联的过程中,计算机软件起了主要的作用。1974年,出现了连接分组网络的协议,其中就包括了TCP/IP协议。TCP/IP有一个非常重要的特点,就是开放性,即TCP/IP的规范和Internet的技术都 是公开的。目的就是使任何厂家生产的计算机都能相互通信,使Internet成为一个开放的系统,这正是 后来Internet得到飞速发展的重要原因。ARPA在1982年接受了TCP/IP,选定Internet为主要的计算机通信系统,并把其它的军用计算机网络都转换到TCP/IP。1983年,ARPAnet分成两部分:一部分军用,称 为MILNET;另一部分仍称ARPAnet,供民用。 1986年,美国国家科学基金组织(NSF)将分布在美国各地的5个为科研教育服务的超级计算机中心互 联,并支持地区网络,形成SNSFnet。1988 年,SNSFnet替代ARPAnet成为Internet的主干网。NSFnet 主干网利用了在ARPAnet中已证明是非常成功的TCP/IP技术,准许各大学、政府或私人科研机构的网络加入。1989年,ARPAnet解散,Internet从军用转向民用。 Internet的发展引起了商家的极大兴趣。1992年,美国IBM、MCI、MERIT三家公司联合组建了一个高级 网络服务公司(SNS),建立了一个新的网络,叫做SNSnet,成为Internet的另一个主干网。它与SNSFnet不同,NSFnet是由国家出资建立的,而SNSnet则是SNS 公司所有,从而使Internet开始走向商业化。 1995年4月30日,SNSFnet正式宣布停止运作。而此时Internet的骨干网已经覆盖了全球91个国家,主 机已超过400万台。而在当前,因特网仍以惊人的速度向前发展 在90年代,超文本标识语言(HTML),即一个可以获得因特网的图像信息的超文本因特网协议被采 用,使每一个人可以产生自己的图像页面(网址),然后成为一个巨大的虚拟超文本网络的组成部分。 这个增强型的因特网又被非正式地称为万维网,与此同时产生了数量庞大的新用户群。于是,许多人 用"因特网” 一词指这个网络的物理结构,包括连接所有事物的客户机、服务器和网络;而用"万维网”一词指利用这个网络可以访问的所有网站和信息。
北京时间1987年9月14日,物理研究员钱天白建立起一个网络节点,通过电话拨号连接到国际互联网, 向他的德国朋友发出来自中国的第一封电子邮件:Across the Great Wall we can reach every corner in the world,自此,中国与国际计算机网络开始连接在一起
同一设备之间的程序之间通讯 可以通过管道符 或 套接字;
两台不同的设备之间通讯 通过端口号进行通讯。
一、http协议——超文本传输协议
1.http相关概念
- 互联网:是网络的网络,是所有类型网络的母集
- 因特网:世界上最大的互联网网络。即因特网概念从属于互联网概念。习惯上,大家把连接在因特网上的计算机都成为主机。
- 万维网:WWW(world wide web)万维网并非某种特殊的计算机网络,是一个大规模的、联机式的信息贮藏库,使用链接的方法能非常方便地从因特网上的一个站点访问另一个站点(超链技术),具有提供分布式服务的特点。万维网是一个分布式的超媒体系统,是超文本系统的扩充,基于B/S架构实现
- URL:万维网使用统一资源定位符(Uniform Resource Locator)来标志万维网上的各种文档,并使每个文档在整个因特网的范围内具有唯一的标识符URL。
- HTTP:为解决"用什么样的网络协议来实现整个因特网上的万维网文档”这一难题,就要使万维网客户程序(以浏览器为主,但不限于浏览器)与万维网服务器程序之间的交互遵守严格的协议,即超文本传送协议(HyperText Transfer Protocol)。HTTP是处于应用层的协议,使用TCP传输层协议进行可靠的传送。因此,需要特别提醒的是,万维网是基于因特网的一种广泛因特网应用系统,且万维网采用的是HTTP(80/TCP)和 HTTPS(443/TCP)的传输协议,但因特网还有其他的网络应用系统(如:FTP、SMTP等等)。
- HTML:为了解决"怎样使不同作者创作的不同风格的万维网文档,都能在因特网上的各种主机上显示出来,同时使用户清楚地知道在什么地方存在着链接”这一问题,万维网使用超文本标记语言(HyperText Markup Language),使得万维网页面的设计者可以很方便地用链接从页面的某处链接到因特网的任何一个万维网页面,并且能够在自己的主机品目上将这些页面显示出来。HTML与txt一样,仅仅是是一种文档,不同之处在于,这种文档专供于浏览器上为浏览器用户提供统一的界面呈现的统一规约。且具备结构化的特征,这是txt所不具备的强制规定。
2.访问浏览器的过程
3.http协议通信过程
HTTP(HyperText Transfer Protocol,超文本传输协议)是一种用于分布式、协作式和超媒体信息系统的应用层协议。HTTP是万维网的数据通信的基础设计HTTP最初的目的是为了提供一种远距离共享知识的方式,借助多文档进行关联实现超文本,连成相互参阅的WWW(world wide web,万维网)
HTTP的发展是由蒂姆·伯纳斯-李(Tim Berners-Lee)于1989年在欧洲核子研究组织(CERN)所发起。HTTP的标准制定由万维网协会(World Wide Web Consortium,W3C)和互联网工程任务组(Internet Engineering Task Force,IETF)进行协调,最终发布了一系列的RFC,其中最著名的是1999年6月公布的 RFC 2616,定义了HTTP协议中现今广泛使用的一个版本——HTTP 1.1版
4.http相关技术
4.1WEB开发语言
http: Hyper Text Transfer Protocol 应用层协议,默认端口: 80/tcp
WEB前端开发语言:
- html
- css
- javascript
4.2html
Hyper Text Markup Language 超文本标记语言,编程语言,主要负责实现页面的结构
<html>
<head>
<meta http-equiv=Content-Type content="text/html;charset=utf-8">
<title>HTML语言</title>
</head>
<body>
<img src="http://bdpc.hfbdqnedu.com/new/2019img/logo.png" >
<h1 style="color:red">欢迎</h1>
<p><a href=http://www.magedu.com>课工场</a>欢迎你</p>
</body>
</html>
4.3CSS
Cascading Style Sheet 层叠样式表, 定义了如何显示(装扮) HTML 元素,比如:字体大小和颜色属性等。样式通常保存在外部的 .css 文件中,用于存放一些HTML文件的公共属性,从而通过仅编辑一个简单的 CSS 文档,可以同时改变站点中所有页面的布局和外观。
#test.html 建议用Vscode创建文件,用记事本可能会出现乱码
<html>
<head>
<meta http-equiv=Content-Type content="text/html;charset=utf-8">
<link rel="stylesheet" type="text/css" href="mystyle.css" />
</head>
<body>
<h1>这是 heading 1</h1>
<p>这是一段普通的段落。请注意,该段落的文本是红色的。在 body 选择器中定义了本页面中的默认文本颜
色。</p>
<p class="ex">该段落定义了 class="ex"。该段落中的文本是蓝色的。</p>
</body>
</html>
#mystyle.css
body {color:red}
h1 {color:#00ff00}
p.ex {color:rgb(0,0,255)}
4.4JS
javascript,实现网页的动画效果,但实属于静态资源
,Java和javascript的关系: 周杰和周杰伦的关系
<!DOCTYPE html>
<html>
<head>
<meta http-equiv=Content-Type content="text/html;charset=utf-8">
</head>
<body>
<h2>我的第一个 JavaScript</h2>
<button type="button"
onclick="document.getElementById('demo').innerHTML = Date()">
点击这里来显示日期和时间
</button>
<p id="demo"></p>
</body>
</html>
5.MIME——Multipurpose Internet Mail Extensions 多用途互联网邮件扩展
文件 /etc/mime.types ,来自于mailcap包
MIME格式:type/subtype
text/plain
text/html
text/css
image/jpeg jpg jpeg
image/png
video/mp4
application/javascript
6.URI URN URL的区别
6.1URI
URI: Uniform Resource Identifier 统一资源标识,分为URL 和 URN
6.2URN
URN:Uniform Resource Naming,统一资源命名
示例: P2P下载使用的磁力链接是URN的一种实现
magnet:?xt=urn:btih:660557A6890EF888666
6.3URL
URL:Uniform Resorce Locator,统一资源定位符,用于描述某服务器某特定资源位置
两者区别:URN如同一个人的名称,而URL代表一个人的住址。换言之,URN定义某事物的身份,而URL提供查找该事物的方法。URN仅用于命名,而不指定地址
URL组成
<scheme>://<user>:<password>@<host>:<port>/<path>;<params>?<query>#<frag>
名称 | 含义 |
---|---|
scheme | 方案,访问服务器以获取资源时要使用哪种协议 |
user | 用户,某些方案访问资源时需要的用户名 |
password | 密码,用户对应的密码,中间用:分隔 |
Host | 主机,资源宿主服务器的主机名或IP地址 |
port | 端口,资源宿主服务器正在监听的端口号,很多方案有默认端口号 |
path | 路径,服务器资源的本地名,由一个/将其与前面的URL组件分隔 |
params | 参数,指定输入的参数,参数为名/值对,多个参数,用;分隔 |
query | 查询,传递参数给程序,如数据库,用?分隔,多个查询用&分隔 |
frag | 片段,一小片或一部分资源的名字,此组件在客户端使用,用#分隔 |
6.4示例
我们平时访问京东网页的时候,实际是访问京东的文件
URL实际作用是指明这个文件的具体位置;默认的根在/var/www/html下;
举例 http://192.168.241.11/ a.jpg 这个a.jpg 首先是在192.168.241.11这台主机服务器上;/代表是网页程序的根(nginx的根 /usr/share/nginx/html)
访问 http://192.168.241.11/ a.jpg 实际上是访问 192.168.241.11/usr/share/nginx/html/a.jpg
URN是指资源具体叫什么名字;URL是描述资源的具体位置
7.网站访问量
网站访问量统计的重要指标
- IP(独立IP):即Internet Protocol,指独立IP数。一天内来自相同客户机IP 地址只计算一次,记录远程客户机IP地址的计算机访问网站的次数,是衡量网站流量的重要指标
- PV(访问量): 即Page View, 页面浏览量或点击量,用户每次刷新即被计算一次,PV反映的是浏览某网站的页面数,PV与来访者的数量成正比,PV并不是页面的来访者数量,而是网站被访问的页面数量
- UV(独立访客):即Unique Visitor,访问网站的一台电脑为一个访客。一天内相同的客户端只被计算一次。可以理解成访问某网站的电脑的数量。网站判断来访电脑的身份是通过cookies实现的。如果更换了IP后但不清除cookies,再访问相同网站,该网站的统计中UV数是不变的
8.http工作机制
一次http事务包括:
- http请求:http request
- http响应:http response
Web资源:web resource, 一个网页由多个资源(文件)构成,打开一个页面,通常会有多个资源展示出来,但是每个资源都要单独请求。因此,一个"Web 页面”通常并不是单个资源,而是一组资源的集合
资源类型:
- 静态文件:无需服务端做出额外处理,服务器端和客户端的文件内容相同
常见文件后缀:.html, .txt, .jpg, .js, .css, .mp3, .avi
- 动态文件:服务端执行程序,返回执行的结果,服务器端和客户端的文件内容不相同
常见文件后缀:.php, .jsp ,.asp
8.1串行和并行连接
8.2串行、持久连接和管道
8.3如何提高http连接性能
- 并行连接:通过多条TCP连接发起并发的HTTP请求
- 持久连接:keep-alive,重用TCP连接,以消除连接和关闭的时延,以事务个数和时间来决定是否关闭连接
- 管道化连接:通过共享TCP连接,发起并发的HTTP请求
- 复用的连接:交替传送请求和响应报文(实验阶段)
9.http协议版本
9.1http 0.9
1991,原型版本,功能简陋,只有一个命令GET。GET /index.html ,服务器只能回应HTML格式字符串,不能回应别的格式
9.2http 1.0
1996年5月,支持cache, MIME, method
每个TCP连接只能发送一个请求,发送数据完毕,连接就关闭,如果还要请求其他资源,就必须再新建一个连接引入了POST命令和HEAD命令头信息是 ASCII 码,后面数据可为任何格式。服务器回应时会告诉客户端,数据是什么格式,即Content-Type字段的作用。这些数据类型总称为MIME 多用途互联网邮件扩展,每个值包括一级类型和二级类型,预定义的类型,也可自定义类型, 常见Content-Type值:text/xml image/jpeg audio/mp3
9.3http 1.1
1997年1月,引入了持久连接(persistent connection),即TCP连接默认不关闭,可以被多个请求复用,不用声明Connection: keep-alive。对于同一个域名,大多数浏览器允许同时建立6个持久连接引入了管道机制,即在同一个TCP连接里,客户端可以同时发送多个请求,进一步改进了HTTP协议的效率新增方法:PUT、PATCH、OPTIONS、DELETE同一个TCP连接里,所有的数据通信是按次序进行的。服务器只能顺序处理回应,前面的回应慢,会有许多请求排队,造成"队头堵塞"(Head-of-line blocking)为避免上述问题,两种方法:一是减少请求数,二是同时多开持久连接。网页优化技巧,如合并脚本和样式表、将图片嵌入CSS代码、域名分片(domain sharding)等HTTP 协议不带有状态,每次请求都必须附上所有信息。请求的很多字段都是重复的,浪费带宽,影响速度
9.4http 1.0 和http 1.1 的区别
- 缓存处理,在HTTP1.0中主要使用header里的If-Modified-Since,Expires来做为缓存判断的标准,HTTP1.1则引入了更多的缓存控制策略例如Entity tag,If-Unmodified-Since, If-Match, If-NoneMatch等更多可供选择的缓存头来控制缓存策略
- 带宽优化及网络连接的使用,HTTP1.0中,存在一些浪费带宽的现象,例如:客户端只是需要某个对象的一部分,而服务器却将整个对象送过来了,并且不支持断点续传功能,HTTP1.1则在请求头引入了range头域,它允许只请求资源的某个部分,即返回码是206(Partial Content),方便了开发者自由的选择以便于充分利用带宽和连接
- 错误通知的管理,在HTTP1.1中新增24个状态响应码,如409(Conflict)表示请求的资源与资源当前状态冲突;410(Gone)表示服务器上的某个资源被永久性的删除
- Host 头处理,在HTTP1.0中认为每台服务器都绑定一个唯一的IP地址,因此,请求消息中的URL并没有传递主机名(hostname)。但随着虚拟主机技术的发展,在一台物理服务器上可以存在多个虚拟主机(Multi-homed Web Servers),并且它们共享一个IP地址。HTTP1.1的请求消息和响应消息都应支持Host头域,且请求消息中如果没有Host头域会报告一个错误(400 Bad Request)
- 长连接,HTTP 1.1支持持久连接(PersistentConnection)和请求的流水线(Pipelining)处理,在一个TCP连接上可以传送多个HTTP请求和响应,减少了建立和关闭连接的消耗和延迟,在HTTP1.1中默认开启Connection: keep-alive,弥补了HTTP1.0每次请求都要创建连接的缺点
9.5http 1.0 和 http 1.1 的问题
- HTTP1.x在传输数据时,每次都需要重新建立连接,无疑增加了大量的延迟时间,特别是在移动端更为突出
- HTTP1.x在传输数据时,所有传输的内容都是明文,客户端和服务器端都无法验证对方的身份,无法保证数据的安全性
- HTTP1.x在使用时,header里携带的内容过大,增加了传输的成本,并且每次请求header基本不怎么变化,尤其在移动端增加用户流量
- 虽然HTTP1.x支持了keep-alive,来弥补多次创建连接产生的延迟,但是keep-alive使用多了同样会给服务端带来大量的性能压力,并且对于单个文件被不断请求的服务(例如图片存放网站),keepalive可能会极大的影响性能,因为它在文件被请求之后还保持了不必要的连接很长时间
9.6总结
http版本 | 区别 |
---|---|
http 0.9 | 只有下载 没有上传 |
http 1.0 | 没有长连接可以下载和上传 |
http 1.1 | 支持长连接可以下载和上传 |
9.7httpds协议
9.7.1https定义
为解决安全问题,网景在1994年创建了HTTPS,并应用在网景导航者浏览器中。 最初,HTTP是与SSL一起使用的;在SSL逐渐演变到TLS时(其实两个是一个东西,只是名字不同而已),最新的HTTPS也由在2000年五月公布的RFC 2818正式确定下来。HTTPS就是安全版的HTTP,目前大型网站基本实现全站HTTPS
https实际是http和ssl协议的组合
9.7.2https特点
- HTTPS协议需要到CA申请证书,一般免费证书很少,需要交费
- HTTP协议运行在TCP之上,所有传输的内容都是明文,HTTPS运行在SSL/TLS之上,SSL/TLS运行在TCP之上,所有传输的内容都经过加密的
- HTTP和HTTPS使用的是不同的连接方式,端口不同,前者是80,后者是443
- HTTPS可以有效的防止运营商劫持,解决了防劫持的一个大问题
- HTTPS 实现过程降低用户访问速度,但经过合理优化和部署,HTTPS 对速度的影响还是可以接受的
9.8http2.0协议
http/2.0:2015年,HTTP2.0是SPDY的升级版
- 头信息和数据体都是二进制,称为头信息帧和数据帧
- 复用TCP连接,在一个连接里,客户端和浏览器都可以同时发送多个请求或回应,且不用按顺序一一对应,避免了"队头堵塞",此双向的实时通信称为多工(Multiplexing)
- 引入头信息压缩机制(header compression),头信息使用gzip或compress压缩后再发送;客户端和服务器同时维护一张头信息表,所有字段都会存入这个表,生成一个索引号,不发送同样字段,只发送索引号,提高速度
- HTTP/2 允许服务器未经请求,主动向客户端发送资源,即服务器推送(server push)
10http请求访问的完整过程——重点!
7个过程
- 建立连接
- 接收请求
- 处理请求
- 访问资源
- 构建响应报文
- 发送响应报文
- 记录日志
1.内核收到请求后会根据报文中端口号信息,找到处理该请求的进程,你要找的端口号是80
2.会转交给80端口上的进程(nginx)nginx进程会根据请求对照配置文件进行处理
3.nginx进程分析完,得知要去调用资源,由于nginx是进程无法直接调用磁盘上的资源,所以需要内核协助获取资源(a.jpg)
4.内核去磁盘调用资源,找到后再将资源转交给nginx进程
5.nginx进程拿到资源后会构想响应报文,构建完成后再发给内核
6.内核再将资源发送给网卡,通过网卡发送给客户机
10.1建立连接
接收或拒绝连接请求
10.2接收请求
接收客户端请求报文中对某资源的一次请求的过程
Web访问响应模型(Web I/O)
- 单进程I/O模型:启动一个进程处理用户请求,而且一次只处理一个,多个请求被串行响应
- 多进程I/O模型:并行启动多个进程,每个进程响应一个连接请求
- 复用I/O结构:启动一个进程,同时响应N个连接请求
- 复用的多进程I/O模型:启动M个进程,每个进程响应N个连接请求,同时接收M*N个请求
10.3处理请求
服务器对请求报文进行解析,并获取请求的资源及请求方法等相关信息,根据方法,资源,首部和可选的主体部分对请求进行处理
常用请求Method: GET、POST、HEAD、PUT、DELETE、TRACE、OPTIONS
10.4访问资源
服务器获取请求报文中请求的资源web服务器,即存放了web资源的服务器,负责向请求者提供对方请求的静态资源,或动态运行后生成的资源
10.5构建响应报文
一旦Web服务器识别除了资源,就执行请求方法中描述的动作,并返回响应报文。响应报文中 包含有响应状态码、响应首部,如果生成了响应主体的话,还包括响应主体
1)响应实体:如果事务处理产生了响应主体,就将内容放在响应报文中回送过去。响应报文中通常包括:
- 描述了响应主体MIME类型的Content-Type首部
- 描述了响应主体长度的Content-Length
- 实际报文的主体内容
2)URL重定向:web服务构建的响应并非客户端请求的资源,而是资源另外一个访问路径
3)MIME类型: Web服务器要负责确定响应主体的MIME类型。多种配置服务器的方法可将MIME类型
与资源管理起来
- 魔法分类:Apache web服务器可以扫描每个资源的内容,并将其与一个已知模式表(被称为魔法文件)进行匹配,以决定每个文件的MIME类型。这样做可能比较慢,但很方便,尤其是文件没有标准扩展名时
- 显式分类:可以对Web服务器进行配置,使其不考虑文件的扩展名或内容,强制特定文件或目录内容拥有某个MIME类型
- 类型协商: 有些Web服务器经过配置,可以以多种文档格式来存储资源。在这种情况下,可以配置Web服务器,使其可以通过与用户的协商来决定使用哪种格式(及相关的MIME类型)"最好"
10.6发送响应报文
Web服务器通过连接发送数据时也会面临与接收数据一样的问题。服务器可能有很多条到各个客户端的连接,有些是空闲的,有些在向服务器发送数据,还有一些在向客户端回送响应数据。服务器要记录连接的状态,还要特别注意对持久连接的处理。对非持久连接而言,服务器应该在发送了整条报文之后,关闭自己这一端的连接。对持久连接来说,连接可能仍保持打开状态,在这种情况下,服务器要正确地计算Content-Length首部,不然客户端就无法知道响应什么时候结束
10.7记录日志
最后,当事务结束时,Web服务器会在日志文件中添加一个条目,来描述已执行的事务
11.http协议及报文头部结构
http协议:stateless 无状态, 服务器无法持续追踪访问者来源
解决http协议无状态方法
- cookie 客户端存放
- session 服务端存放
11.1http请求报文
11.1.1方法
- GET: 获取资源 当前网络请求中,绝大部分使用的是 GET 方
- HEAD: 获取报文首部,主要用于确认 URL 的有效性以及资源更新的日期时间等
- POST: 传输实体主体 (比如传输 用户名密码)
- PUT: 上传文件(比如写博客)
- PATCH: 对资源进行部分修改
- DELETE:删除文件
- OPTIONS:查询支持的方法(查看服务端可以支持哪些方法)
- CONNECT:要求在与代理服务器通信时建立隧道(类似加密)
- TRACE:追踪路径
11.1.2URL——指明资源具体位置
<scheme>://<user>:<password>@<host>:<port>/<path>;<params>?<query>#<frag>
- scheme(http 超文本传输协议、https 安全的http协议、ftp 文件传输协议)
- user:帐号
- password:密码
- host:主机名 或 域名 或 ip地址
- port: 服务器端口号
- path:访问资源的路径,相当于组件路径
- params:参数,但是这个不常用,指定一些参数,譬如指定传输方式
- qurey:查询参数
- frag:html资源片段,譬如html文档过大的时候,frag定位到html的一部分
11.1.3首部字段
使用首部字段是为了给浏览器和服务器提供报文主体大小、所使用的语言、认证信息等内容,HTTP 首部字段是由首部字段名和字段值构成的,中间用冒号“:” 分隔
11.1.3.1首部的分类
11.1.3.1.1通用首部——请求报文和响应报文两方都会使用的首部
- Date: 报文的创建时间
- Connection:连接状态,如keep-alive, close
- Via:显示报文经过的中间节点(代理,网关)
- Cache-Control:控制缓存,如缓存时长
- MIME-Version:发送端使用的MIME版本
- Warning:错误通知
11.1.3.1.2请求首部——从客户端向服务器端发送请求报文时使用的首部
补充了请求的附加内容、客户端信息、请求内容相关优先级等信息
- Accept:通知服务器自己可接受的媒体类型
- Accept-Charset: 客户端可接受的字符集
- Accept-Encoding:客户端可接受编码格式,如gzip
- Accept-Language:客户端可接受的语言
- Client-IP: 请求的客户端IP
- Host: 请求的服务器名称和端口号
- Referer:跳转至当前URI的前一个URL
- User-Agent:客户端代理,浏览器版本
- Expect:允许客户端列出某请求所要求的服务器行为(条件式请求首部)
- If-Modified-Since:自从指定的时间之后,请求的资源是否发生过修改(条件式请求首部)
- If-Unmodified-Since:与上面相反(条件式请求首部)
- If-None-Match:本地缓存中存储的文档的ETag标签是否与服务器文档的Etag不匹配(条件式请求首部)
- If-Match:与上面相反 (条件式请求首部)
- Authorization:向服务器发送认证信息,如账号和密码(安全请求首部)
- Cookie: 客户端向服务器发送cookie
- Proxy-Authorization: 向代理服务器认证 ( 代理请求首部)
11.1.3.1.3响应首部——从服务器端向客户端返回响应报文时使用的首部
补充了响应的附加内容,也会要求客户端附加额外的内容信息
-
协商首部:某资源有多种表示方法时使用
-
Accept-Ranges:服务器可接受的请求范围类型
-
Vary:服务器查看的其它首部列表
-
-
安全响应首部:
-
Set-Cookie:向客户端设置cookie
-
WWW-Authenticate:来自服务器对客户端的质询列表
-
-
信息性:
-
Age:从最初创建开始,响应持续时长
-
Server:服务器程序软件名称和版本
-
-
协商首部:某资源有多种表示方法时使用
-
Accept-Ranges:服务器可接受的请求范围类型
-
Vary:服务器查看的其它首部列表
-
-
安全响应首部:
-
Set-Cookie:向客户端设置cookie
-
WWW-Authenticate:来自服务器对客户端的质询列表
-
-
信息性:
-
Age:从最初创建开始,响应持续时长
-
Server:服务器程序软件名称和版本
-
11.1.3.1.4实体首部——针对请求报文和响应报文的实体部分使用的首部
补充了资源内容更新时间等与实体有关的的信息
-
缓存相关:
-
ETag:实体的扩展标签
-
Expires:实体的过期时间
-
Last-Modified:最后一次修改的时间
-
-
Allow: 列出对此资源实体可使用的请求方法
-
Location:告诉客户端真正的实体位于何处
-
Content-Encoding:对主体执行的编码
-
Content-Language:理解主体时最适合的语言
-
Content-Location: 实体真正所处位置
-
Content-Type:主体的对象类型,如text
11.1.3.1.4实体
请求时附加的数据或响应时附加的数据,例如:登录网站时的用户名和密码,博客的上传文章,论坛上的发言等
11.1.3.2Request报文格式
<method> <request-URL> <version>
<headers>
<entity-body>
GET / HTTP/1.1
Accept: */*
Accept-Encoding: gzip, deflate
Connection: keep-alive
Host: www.magedu.com
User-Agent: HTTPie/0.9.4
11.2响应报文
11.2.1Request报文格式
<version> <status> <reason-phrase>
<headers>
<entity-body>
curl -v 192.168.91.100 |head
HTTP/1.1 200 OK
Cache-Control: max-age=3, must-revalidate
Connection: keep-alive
Content-Encoding: gzip
Content-Type: text/html; charset=UTF-8
Date: Thu, 07 Nov 2019 03:44:14 GMT
Server: Tengine
Transfer-Encoding: chunked
Vary: Accept-Encoding
Vary: Accept-Encoding, Cookie
11.2.2状态码
三位数字,标记请求处理过程中发生的情况
11.2.2.1http协议状态码分类
状态码 | 范围 | 含义 |
---|---|---|
1xx | 100-101 | 信息提示 |
2xx | 200-206 | 成功 |
3xx | 300-307 | 重定向 |
4xx | 400-415 | 错误类信息,客户端错误 |
5xx | 500-505 | 错误类信息,服务端错误 |
11.2.2.2http协议常用的状态码
状态码 | 含义 |
---|---|
200 | 成功,请求数据通过响应报文的entity-body部分发送;OK |
301 | 请求的URL指向的资源已经被删除;但在响应报文中通过首部Location指明了资源现在所处的新位置;Moved Permanently |
302 | 响应报文Location指明资源临时新位置 Moved Temporarily |
304 | 客户端发出了条件式请求,但服务器上的资源未曾发生改变,则通过响应此响应状态码通知客户端;Not Modified |
307 | 浏览器内部重定向 |
401 | 需要输入账号和密码认证方能访问资源;Unauthorized |
403 | 请求被禁止;Forbidden |
404 | 服务器无法找到客户端请求的资源;Not Found |
500 | 服务器内部错误;Internal Server Error,比如:cgi程序没有执行权限 |
502 | 代理服务器从后端服务器收到了一条伪响应,如无法连接到网关;Bad Gateway |
503 | 服务不可用,临时服务器维护或过载,服务器无法处理请求,比如:php服务停止,无法处理php程序 |
504 | 网关超时 |
二、httpd安装
http服务基于C/S结构
1.常见的http服务器程序
- httpd apache,存在C10K(10K connections)问题 静态
- nginx 解决C10K问题lighttpd
- IIS .asp 应用程序服务器
- tomcat .jsp 应用程序服务器 动态
- jetty 开源的servlet容器,基于Java的web容器
- Resin CAUCHO公司,支持servlets和jsp的引擎
- webshpere:IBM公司
- weblogic:BEA,Oracle
- jboss:RedHat,IBM
- oc4j:Oracle
目前国内大多数使用的是nginx,nginx的高并发性能优于httpd apache
2.Apache介绍和特点
2.1Apache——经典的Web服务端
Apache起初由美国的伊利诺伊大学香槟分校的国家超级计算机应用中心开发,目前经历了两大版本分别是1.X和2.X,其可以通过编译安装实现特定的功能
20世纪90年代初,美国国家超级计算机应用中心NCSA开发,1995年开源社区发布apache
apache 名字来源,流传最广的解释是(也是最显而易见的):这个名字来自于一个事实:当Apache在1995年初开发的时候,它是由当时最流行的HTTP服务器NCSA HTTPd 1.3的代码修改而成的,因此是"一个修补的(a patchy)”服务器。然而,在Apache服务器官方网站的FAQ中是这么解释的:"Apache这个名字是为了纪念名为Apache的美洲原住民印第安人的一支,众所周知他们拥有高超的作战策略和无穷的耐性。”贝伦多夫说:"我选择阿帕奇这个名字是取其积极含义。阿帕奇族是最后一个屈服于美国政府的民族。当时我们担心大公司迟早会参与竞争并‘教化’这块最早的网络之地,所以在我看来,阿帕奇是个很好的名称,也有人说这个词一语双关-因为正如Apache(与"a patchy"谐音)的名字所表明的那样,他们确实是在给服务器打补丁。”
软件基金会
ASF:apache software foundation
FSF:Free Software Foundation
2.2Apache功能
- 提供http协议服务
- 多个虚拟主机:IP、Port、FQDN
- CGI:Common Gateway Interface,通用网关接口,支持动态程序
- 反向代理
- 负载均衡
- 路径别名
- 丰富的用户认证机制:basic,digest
- 支持第三方模块
2.3Apache特性
- 高度模块化:core + modules
- DSO:Dynamic Shared Object 动态加载/卸载
- MPM:multi-processing module 多路处理模块
2.4Apache总结
- 功能多
- 稳定
- 善于处理静态资源
2.5MPM(multi-processing module )工作模式
MPM——多路复用模型
2.5.1Prefork模型——多进程I/O模型
每个进程响应一个请求,CentOS 7 httpd默认模型一个主进程:生成和回收n个子进程,创建套接字,不响应请求多个子进程:工作 work进程,每个子进程处理一个请求;系统初始时,预先生成多个空闲进程,等待请求
Prefork MPM——预派生模式
有一个主控制进程,然后生成多个子进程,每个子进程有一个独立的线程响应用户请求,相对比较占用内存,但是比较稳定,可以设置最大和最小进程数,是最古老的一种模式,也是最稳定的模式,适用于访问量不是很大的场景
优点——稳定
缺点——慢,占用资源,不适用于高并发场景
2.5.2Worker模型——复用的多进程I/O模型
多进程多线程,IIS使用此模型
一个主进程:生成m个子进程,每个子进程负责生个n个线程,每个线程响应一个请求,并发响应请求:m*n
Worker MPM——多进程和多线程混合的模型
有一个控制进程,启动多个子进程,每个子进程里面包含固定的线程,使用线程来处理请求,当线程不够使用的时候会再启动一个新的子进程,然后在进程里面再启动线程处理请求,由于其使用了线程处理请求,因此可以承受更高的并发。
优点
相比prefork 占用的内存较少,可以同时处理更多的请求
缺点
使用keep-alive的长连接方式,某个线程会一直被占据,即使没有传输数据,也需要一直等待到超时才会被释放。如果过多的线程,被这样占据,也会导致在高并发场景下的无服务线程可用。(该问题在prefork模式下,同样会发生)
2.5.3Event模型——事件驱动模型(worker模型的变种)
CentOS8 默认模型
一个主进程:生成m个子进程,每个子进程负责生个n个线程,每个线程响应一个请求,并发响应请求:m*n,有专门的监控线程来管理这些keep-alive类型的线程,当有真实请求时,将请求传递给服务线程,执行完毕后,又允许释放。这样增强了高并发场景下的请求处理能力
event MPM是Apache中最新的模式,2012年发布的apache 2.4.X系列正式支持event 模型. 属于事件驱动模型(epoll),每个进程响应多个请求,在现在版本里的已经是稳定可用的模式。它和worker模式很像,最大的区别在于,它解决了keep-alive场景下,长期被占用的线程的资源浪费问题(某些线程因为被keep-alive,空挂在哪里等待,中间几乎没有请求过来,甚至等到超时)。event MPM中,会有一个专门的线程来管理这些keep-alive类型的线程,当有真实请求过来的时候,将请求传递给服务线程,执行完毕后,又允许它释放。这样增强了高并发场景下的请求处理能力event只在有数据发送的时候才开始建立连接,连接请求才会触发工作线程,即使用了TCP的一个选项,叫做延迟接受连接TCP_DEFER_ACCEPT,加了这个选项后,若客户端只进行TCP连接,不发送请求,则不会触发Accept操作,也就不会触发工作线程去干活,进行了简单的防攻击(TCP连接)
优点
单线程响应多请求,占据更少的内存,高并发下表现更优秀,会有一个专门的线程来管理keep-alive类型的线程,当有真实请求过来的时候,将请求传递给服务线程,执行完毕后,又允许它释放
缺点
没有线程安全控制
httpd-2.4:event 稳定版,centos7 以后默认
httpd-2.2:event 测试版,centos6 默认
2.5.4总结
该配置文件是控制三种模型之间的切换的
可以通过调整这三行配置文件进行修改三种模型模式
3.httpd安装和相关文件
3.1httpd安装及启动httpd服务
版本说明
CentOS 7 以上,默认系统是httpd 2.4,CentOS 6 版默认为httpd 2.2
Ubuntu 18.04 默认 Apache/2.4.29
安装方式
包安装: centos发行版,稳定,建议使用
编译:定制或特殊需求
3.1.1httpd安装——yum安装
[root@localhost ~]#yum install httpd -y
#安装httpd服务
[root@localhost ~]#systemctl start httpd
#启用httpd服务
[root@localhost ~]#systemctl stop httpd
#停止httpd服务
[root@localhost ~]#systemctl restart httpd
#重启httpd服务
3.1.2httpd安装——编译安装
编译说明和准备
APR:Apache portable Run-time libraries,Apache可移植运行库,主要为上层的应用程序提供一个可以跨越多操作系统平台使用的底层支持接口库。在早期的Apache版本中,应用程序本身必须能够处理各种具体操作系统平台的细节,并针对不同的平台调用不同的处理函数随着Apache的进一步开发,Apache组织决定将这些通用的函数独立出来并发展成为一个新的项目。这样,APR的开发就从Apache中独立出来,Apache仅仅是使用 APR而已。目前APR主要还是由Apache使用,由于APR的较好的移植性,因此一些需要进行移植的C程序也开始使用APR,开源项目:比如用于服务器压力测试的Flood loader tester
[root@localhost ~]#yum install gcc make pcre-devel openssl-devel expat-devel -y
#安装相关包
[root@localhost ~]#wget https://downloads.apache.org/apr/apr-1.7.4.tar.bz2
#下载源码
[root@localhost ~]#wget https://downloads.apache.org/apr/apr-util-1.6.3.tar.gz
#下载源码
[root@localhost ~]#wget https://downloads.apache.org/httpd/httpd-2.4.58.tar.bz2
#下载源码
[root@localhost ~]#ls
httpd-2.4.58.tar.bz2 apr-1.7.4.tar.bz2 apr-util-1.6.3.tar.gz
[root@localhost ~]#tar xf apr-1.7.4.tar.bz2
[root@localhost ~]#tar xf apr-util-1.6.3.tar.gz
[root@localhost ~]#tar xf httpd-2.4.58.tar.bz2
[root@localhost ~]#ls
httpd-2.4.58 apr-1.7.4 httpd-2.4.58.tar.bz2 apr-1.7.4.tar.bz2
apr-util-1.6.3 apr-util-1.6.3.tar.gz
[root@localhost ~]#mv apr-1.7.4 httpd-2.4.58/srclib/apr
[root@localhost ~]#mv apr-util-1.6.3 httpd-2.4.58/srclib/apr/util
[root@localhost ~]#ls httpd-2.4.58/srclib/
apr Makefile.in
3.2 httpd相关文件
3.2.1配置文件
- /etc/httpd/conf/httpd.conf 主配置文件
- /etc/httpd/conf.d/*.conf 子配置文件
- /etc/httpd/conf.d/conf.modules.d/ 模块加载的配置文件
[root@localhost ~]#cd /etc/httpd/
[root@localhost httpd]#ls
conf conf.d conf.modules.d logs modules run
[root@localhost httpd]#ls conf
httpd.conf magic
[root@localhost httpd]#grep -i include conf/httpd.conf
Include conf.modules.d/*.conf
# Indexes Includes FollowSymLinks SymLinksifOwnerMatch ExecCGI MultiViews
# Possible values include: debug, info, notice, warn, error, crit,
# If you include a trailing / on /webpath then the server will
# To parse .shtml files for server-side includes (SSI):
# (You will also need to add "Includes" to the "Options" directive.)
AddOutputFilter INCLUDES .shtml
IncludeOptional conf.d/*.conf
[root@localhost html]#grep -i "^[a-z]" /etc/httpd/conf/httpd.conf
ServerRoot "/etc/httpd"
#主目录
Listen 80
#监听端口
Include conf.modules.d/*.conf
#包含子目录配置文件
User apache
#使用者 Apache
Group apache
#组 Apache
ServerAdmin root@localhost
#服务器管理员
ServerName www.example.com:80
#服务器名称
DocumentRoot "/var/www/html"
#文档根目录
ErrorLog "logs/error_log"
#错误日志
LogLevel warn
#日志级别
AddDefaultCharset UTF-8
EnableSendfile on
IncludeOptional conf.d/*.conf
httpd -v——显示httpd版本;httpd -t 检查配置语法
[root@localhost httpd]#httpd -v
Server version: Apache/2.4.6 (CentOS)
Server built: May 30 2023 14:01:11
[root@localhost httpd]#httpd -t
AH00558: httpd: Could not reliably determine the server's fully qualified domain name, using localhost.localdomain. Set the 'ServerName' directive globally to suppress this message
Syntax OK
3.2.2服务单元文件
- /usr/lib/systemd/system/httpd.service
- 配置文件:/etc/sysconfig/httpd
[root@node2 ~]#curl 192.168.241.11
#实际访问的主页面位置是192.168.241.11主机的/var/www/htmlindex.html
[root@localhost ~]#cd /var/www/html/
[root@localhost html]#ls
[root@localhost html]#grep "/var/www/html" /etc/httpd/conf/httpd.conf
DocumentRoot "/var/www/html"
<Directory "/var/www/html">
[root@localhost html]#grep "index.html" /etc/httpd/conf/httpd.conf
DirectoryIndex index.html
#在这里可以更改要找寻的html文件 也就是其他主机访问本机的httpd服务要访问的文件
3.2.3服务控制和启动
- systemctl enable|disable httpd.service
- systemctl {start|stop|restart|status|reload} httpd.service
- apachectl start|stop|restart|configtest
- service httpd start|stop|restart|configtest
站点网页文档根目录:/var/www/html
3.2.4模块文件路径
- /etc/httpd/modules
- /usr/lib64/httpd/modules
主服务器程序文件:/usr/sbin/httpd
4.httpd常见配置
4.1指定服务器名
[root@localhost ~]#httpd -t
AH00558: httpd: Could not reliably determine the server's fully qualified domain
name, using centos7.localdomain. Set the 'ServerName' directive globally to
suppress this message
Syntax OK
[root@localhost ~]#vim /etc/httpd/conf/httpd.conf
#ServerName www.example.com:80
servername www.magedu.org
[root@localhost ~]#httpd -t
Syntax OK
4.2包含其他配置文件
4.2.1指令
Include file-path|directory-path|wildcard
IncludeOptional file-path|directory-path|wildcard
4.2.2说明
- Include和IncludeOptional功能相同,都可以包括其它配置文件
- 但是当无匹配文件时,include会报错,IncludeOptional会忽略错误
4.2.3 include 子配置文件
[root@localhost html]#grep -i include /etc/httpd/conf/httpd.conf
Include conf.modules.d/*.conf
# Indexes Includes FollowSymLinks SymLinksifOwnerMatch ExecCGI MultiViews
# Possible values include: debug, info, notice, warn, error, crit,
# If you include a trailing / on /webpath then the server will
# To parse .shtml files for server-side includes (SSI):
# (You will also need to add "Includes" to the "Options" directive.)
AddOutputFilter INCLUDES .shtml
IncludeOptional conf.d/*.conf
4.2.4总目录
[root@localhost html]#grep -i serverroot /etc/httpd/conf/httpd.conf
# with "/", the value of ServerRoot is prepended -- so 'log/access_log'
# with ServerRoot set to '/www' will be interpreted by the
# ServerRoot: The top of the directory tree under which the server's
# ServerRoot at a non-local disk, be sure to specify a local disk on the
# same ServerRoot for multiple httpd daemons, you will need to change at
ServerRoot "/etc/httpd"
4.3监听地址
Listen [IP:]PORT
说明
省略IP表示为本机所有IP
Listen指令至少一个,可重复出现多次
4.4隐藏服务器版本信息
[root@node2 ~]#curl -I 192.168.241.11
HTTP/1.1 403 Forbidden
Date: Mon, 19 Feb 2024 10:14:51 GMT
Server: Apache/2.4.6 (CentOS)
#版本信息
Last-Modified: Thu, 16 Oct 2014 13:20:58 GMT
ETag: "1321-5058a1e728280"
Accept-Ranges: bytes
Content-Length: 4897
Content-Type: text/html; charset=UTF-8
[root@localhost html]#vim /etc/httpd/conf/httpd.conf
[root@localhost html]#systemctl restart httpd
[root@node2 ~]#curl -I 192.168.241.11
HTTP/1.1 403 Forbidden
Date: Mon, 19 Feb 2024 10:17:02 GMT
Server: Apache
Last-Modified: Thu, 16 Oct 2014 13:20:58 GMT
ETag: "1321-5058a1e728280"
Accept-Ranges: bytes
Content-Length: 4897
Content-Type: text/html; charset=UTF-8
4.5持久连接
Persistent Connection:连接建立,每个资源获取完成后不会断开连接,而是继续等待其它的请求完成,默认开启持久连接
断开条件:
- 时间限制:以秒为单位, 默认5s,httpd-2.4 支持毫秒级
- 请求数量: 请求数达到指定值,也会断开
副作用:对并发访问量大的服务器,持久连接会使有些请求得不到响应
折衷:使用较短的持久连接时间
KeepAlive On|Off #开启长连接
KeepAliveTimeout 15 #连接持续15s,可以以ms为单位,默认值为5s 超时等待时间
MaxKeepAliveRequests 500 #持久连接最大接收的请求数,默认值100 限制最大下载资源
测试长连接
[root@localhost html]#echo T > T
[root@localhost html]#echo T1 > T1
[root@localhost html]#echo T2 > T2
[root@localhost html]#ls
T T1 T2
[root@localhost html]#vim /etc/httpd/conf.d/test.conf
KeepAlive On #开启长连接
KeepAliveTimeout 300 #连接持续300s,可以以ms为单位,默认值为5s 超时等待>时间
MaxKeepAliveRequests 2 #持久连接最大接收的请求数,默认值100 限制最大下载>资源
[root@localhost html]#systemctl restart httpd
[root@node2 ~]#curl 192.168.241.11/T
T
[root@node2 ~]#curl 192.168.241.11/T1
T1
[root@node2 ~]#curl 192.168.241.11/T2
T2
[root@node2 ~]#yum install telnet -y
[root@node2 ~]#telnet 192.168.241.11 80
Trying 192.168.241.11...
Connected to 192.168.241.11.
Escape character is '^]'.
GET /T HTTP/1.1
HOST:www.cxk.com
HTTP/1.1 200 OK
Date: Mon, 19 Feb 2024 10:50:05 GMT
Server: Apache
Last-Modified: Mon, 19 Feb 2024 10:26:49 GMT
ETag: "2-611b9880a133a"
Accept-Ranges: bytes
Content-Length: 2
T
GET /T1 HTTP/1.1
HOST:www.wyb.com
HTTP/1.1 200 OK
Date: Mon, 19 Feb 2024 10:50:19 GMT
Server: Apache
Last-Modified: Mon, 19 Feb 2024 10:26:53 GMT
ETag: "3-611b9884b7d6b"
Accept-Ranges: bytes
Content-Length: 3
T1
GET /T2 HTTP/1.1
HOST:www.xzq.com
HTTP/1.1 200 OK
Date: Mon, 19 Feb 2024 10:50:37 GMT
Server: Apache
Last-Modified: Mon, 19 Feb 2024 10:26:58 GMT
ETag: "3-611b9889c9f12"
Accept-Ranges: bytes
Content-Length: 3
Connection: close
T2
Connection closed by foreign host.
#连接被外部主机关闭
4.6DSO(Dynamic Shared Object )加载动态模块配置
Dynamic Shared Object,加载动态模块配置,不需重启即生效动态模块所在路径: /usr/lib64/httpd/modules/
主配置 /etc/httpd/conf/httpd.conf 文件中指定加载模块配置文件
ServerRoot "/etc/httpd"
Include conf.modules.d/*.conf
查看静态编译的模块:httpd -l
查看静态编译及动态装载的模块:httpd -M
[root@localhost html]#httpd -M
Loaded Modules:
core_module (static)
so_module (static)
http_module (static)
access_compat_module (shared)
actions_module (shared)
alias_module (shared)
allowmethods_module (shared)
auth_basic_module (shared)
auth_digest_module (shared)
authn_anon_module (shared)
authn_core_module (shared)
authn_dbd_module (shared)
authn_dbm_module (shared)
authn_file_module (shared)
authn_socache_module (shared)
authz_core_module (shared)
authz_dbd_module (shared)
authz_dbm_module (shared)
authz_groupfile_module (shared)
authz_host_module (shared)
authz_owner_module (shared)
authz_user_module (shared)
autoindex_module (shared)
cache_module (shared)
cache_disk_module (shared)
data_module (shared)
dbd_module (shared)
deflate_module (shared)
dir_module (shared)
dumpio_module (shared)
echo_module (shared)
env_module (shared)
expires_module (shared)
ext_filter_module (shared)
filter_module (shared)
headers_module (shared)
include_module (shared)
info_module (shared)
log_config_module (shared)
logio_module (shared)
mime_magic_module (shared)
mime_module (shared)
negotiation_module (shared)
remoteip_module (shared)
reqtimeout_module (shared)
rewrite_module (shared)
setenvif_module (shared)
slotmem_plain_module (shared)
slotmem_shm_module (shared)
socache_dbm_module (shared)
socache_memcache_module (shared)
socache_shmcb_module (shared)
status_module (shared)
substitute_module (shared)
suexec_module (shared)
unique_id_module (shared)
unixd_module (shared)
userdir_module (shared)
version_module (shared)
vhost_alias_module (shared)
dav_module (shared)
dav_fs_module (shared)
dav_lock_module (shared)
lua_module (shared)
mpm_prefork_module (shared)
proxy_module (shared)
lbmethod_bybusyness_module (shared)
lbmethod_byrequests_module (shared)
lbmethod_bytraffic_module (shared)
lbmethod_heartbeat_module (shared)
proxy_ajp_module (shared)
proxy_balancer_module (shared)
proxy_connect_module (shared)
proxy_express_module (shared)
proxy_fcgi_module (shared)
proxy_fdpass_module (shared)
proxy_ftp_module (shared)
proxy_http_module (shared)
proxy_scgi_module (shared)
proxy_wstunnel_module (shared)
systemd_module (shared)
cgi_module (shared)
[root@localhost conf.modules.d]#httpd -M |grep basic
auth_basic_module (shared)
[root@localhost httpd]#ls
conf conf.d conf.modules.d logs modules run
[root@localhost httpd]#cd conf.modules.d/
[root@localhost conf.modules.d]#ls
00-base.conf 00-lua.conf 00-proxy.conf 01-cgi.conf
00-dav.conf 00-mpm.conf 00-systemd.conf
[root@localhost conf.modules.d]#vim 00-base.conf
[root@localhost conf.modules.d]#httpd -M |grep basic
将该行注释掉就看不到 auth_basic_module (shared)了
4.7MPM(Multi-Processing Module )多路处理模块
httpd 支持三种MPM工作模式:prefork, worker, event
[root@localhost conf.modules.d]#ls
00-base.conf 00-lua.conf 00-proxy.conf 01-cgi.conf
00-dav.conf 00-mpm.conf 00-systemd.conf
[root@localhost conf.modules.d]#vim 00-mpm.conf
将进程数量修改为10(准备10个进程以便其他客户端来使用httpd服务)
4.7.1Prefork模式相关的配置
StartServers 100
MinSpareServers 50
MaxSpareServers 80
ServerLimit 2560 #最多进程数,最大值 20000
MaxRequestWorkers 2560 #最大的并发连接数,默认256
MaxConnectionsPerChild 4000 #子进程最多能处理的请求数量。在处理MaxRequestsPerChild 个
请求之后,子进程将会被父进程终止,这时候子进程占用的内存就会释放(为0时永远不释放)
MaxRequestsPerChild 4000 #从 httpd.2.3.9开始被MaxConnectionsPerChild代替
可以将其写到子配置文件中
4.7.2 Worker 和 Event 模式相关的配置
ServerLimit 16 #最多worker进程数 Upper limit on configurable number of
processes
StartServers 10 #Number of child server processes created at startup
MaxRequestWorkers 150 #Maximum number of connections that will be processed
simultaneously
MinSpareThreads 25
MaxSpareThreads 75
ThreadsPerChild 25 #Number of threads created by each child process
4.8定义Main server的文档页面路径
[root@localhost ~]#vim /etc/httpd/conf/httpd.conf
[root@node2 ~]#curl 192.168.241.11/
123
[root@node2 ~]#curl 192.168.241.11/test
blog
4.9定义站点默认主页面文件
[root@localhost ~]#grep -n index /etc/httpd/conf/httpd.conf
163: DirectoryIndex index.html
[root@localhost blog]#echo 123 > index.txt
[root@localhost blog]#systemctl restart httpd
[root@node2 ~]#curl 192.168.241.11
123
4.10针对目录和URL实现访问控制
Options指令
后跟一个或多个以空白字符分隔的选项列表,在选项前的+,- 表示增加或删除指定选项
选项 | 含义 |
---|---|
Indexes | 指明的URL路径下不存在与定义的主页面资源相符的资源文件时,返回索引列表给用户 |
FollowSymLinks | 允许访问符号链接文件所指向的源文件 |
None | 全部禁用 |
All | 全部允许 |
Options 可以写在目录里 也可以写在外面
4.11虚拟主机——重点!
httpd 支持在一台物理主机上实现多个网站,即多虚拟主机
网站的唯一标识:
- IP相同,但端口不同
- IP不同,但端口均为默认端口
- FQDN不同, IP和端口都相同
多虚拟主机有三种实现方案:
- 基于ip:为每个虚拟主机准备至少一个ip地址
- 基于port:为每个虚拟主机使用至少一个独立的port
- 基于FQDN:为每个虚拟主机使用至少一个FQDN,请求报文中首部 Host:www.kgc.com
虚拟主机的三种实现方式:基于IP、基于端口、基于域名;
最常用的是基于域名
4.11.1基于IP
访问192.168.241.11 相当于访问京东
访问192.168.241.12 相当于访问淘宝
[root@localhost html]#vim /etc/httpd/conf/httpd.conf
[root@localhost html]#vim /etc/httpd/conf.d/test.conf
[root@localhost html]#cd /usr/share/doc/httpd-2.4.6/
[root@localhost httpd-2.4.6]#ls
ABOUT_APACHE httpd-languages.conf LICENSE
CHANGES httpd-manual.conf NOTICE
httpd-dav.conf httpd-mpm.conf proxy-html.conf
httpd-default.conf httpd-multilang-errordoc.conf README
httpd-info.conf httpd-vhosts.conf VERSIONING
[root@localhost httpd-2.4.6]#vim httpd-vhosts.conf
[root@localhost httpd-2.4.6]#cd /opt
[root@localhost opt]#mkdir html
[root@localhost opt]#ls
blog html rh
[root@localhost opt]#mkdir html/{12,22}
[root@localhost opt]#cd html/
[root@localhost html]#ls
12 22
[root@localhost opt]#echo 12 > 12/index.html
[root@localhost opt]#echo 22 > 11/index.html
[root@localhost opt]#ifconfig ens33:0 192.168.241.12/24
[root@node2 ~]#curl 192.168.241.12
12
[root@node2 ~]#curl 192.168.241.11
22
4.11.2基于端口
访问192.168.241.11:80 相当于访问京东
访问192.168.241.11:8080 相当于访问淘宝
[root@localhost html]#vim /etc/httpd/conf.d/test.conf
[root@node2 ~]#curl 192.168.241.11
22
[root@node2 ~]#curl 192.168.241.12:9527
curl: (7) Failed connect to 192.168.241.12:9527; Connection refused
[root@node2 ~]#curl 192.168.241.12:9527
12
排错
4.11.3基于域名
访问www.lucky.com 相当于访问lucky
访问www.cloud.com 相当于访问cloud
[root@localhost html]#vim /etc/httpd/conf.d/test.conf
[root@node2 ~]#vim /etc/hosts
[root@node2 ~]#curl www.lucky.com
22
[root@node2 ~]#curl www.cloud.com
12
4.12基于客户端IP地址实现访问控制
4.12.1黑名单
不能有失败,至少有一个成功匹配才成功,即失败优先
<RequireAll>
RequireAll all granted
RequireAll not ip 172.16.1.1
#拒绝特定IP
</RequireAll>
[root@localhost ~]#vim /etc/httpd/conf.d/test.conf
<directory /opt>
<RequireAll>
require all granted
require not ip 192.168.241.1
#拒绝特定IP 192.168.241.1 拒绝其访问本机的httpd服务
</RequireAll>
</directory>
alias /opt /opt/html
[root@localhost opt]#mkdir /opt/html
[root@localhost ~]#echo /opt/html/index.html > /opt/html/index.html
[root@localhost ~]#systemctl restart httpd
[root@localhost ~]#cat /opt/html/index.html
/opt/html/index.html
[root@node2 ~]#curl 192.168.241.11/opt/
/opt/html/index.html
4.12.2白名单
多个语句有一个成功,则成功,即成功优先
<RequireAny>
RequireAny all denied
require ip 172.16.1.1
#允许特定IP
</RequireAny>
[root@localhost ~]#vim /etc/httpd/conf.d/test.conf
<directory /opt>
<RequireAny>
require all denied
require ip 192.168.241.1
#允许特定IP 192.168.241.1 只允许该IP访问本机的httpd服务 其他主机的拒绝访问
</RequireAny>
</directory>
alias /opt /opt/html
[root@localhost ~]#systemctl restart httpd
[root@node2 ~]#curl 192.168.241.11/opt/
<!DOCTYPE HTML PUBLIC "-//IETF//DTD HTML 2.0//EN">
<html><head>
<title>403 Forbidden</title>
</head><body>
<h1>Forbidden</h1>
<p>You don't have permission to access /opt/
on this server.</p>
</body></html>
三、重点总结
1.http版本区别
http版本 | 区别 |
---|---|
http 0.9 | 只有下载 没有上传 |
http 1.0 | 没有长连接可以下载和上传 |
http 1.1 | 支持长连接可以下载和上传 |
2.URL
URI: Uniform Resource Identifier 统一资源标识,分为URL 和 URN
URL:Uniform Resorce Locator,统一资源定位符,用于描述某服务器某特定资源位置
两者区别:URN如同一个人的名称,而URL代表一个人的住址。换言之,URN定义某事物的身份,而URL提供查找该事物的方法。URN仅用于命名,而不指定地址
URL实际作用是指明这个文件的具体位置;默认的根在/var/www/html下;
举例 http://192.168.241.11/ a.jpg 这个a.jpg 首先是在192.168.241.11这台主机服务器上;/代表是网页程序的根(nginx的根 /usr/share/nginx/html)
访问 http://192.168.241.11/ a.jpg 实际上是访问 192.168.241.11/usr/share/nginx/html/a.jpg
URN是指资源具体叫什么名字;URL是描述资源的具体位置
3.长连接
KeepAlive On|Off #开启长连接
KeepAliveTimeout 15 #连接持续15s,可以以ms为单位,默认值为5s 超时等待时间
MaxKeepAliveRequests 500 #持久连接最大接收的请求数,默认值100 限制最大下载资源
4.静态资源/动态资源
查看静态编译的模块:httpd -l
查看静态编译及动态装载的模块:httpd -M
5.httpd服务一次请求的7个过程
- 建立连接
- 接收请求
- 处理请求
- 访问资源
- 构建响应报文
- 发送响应报文
- 记录日志
6.httpd运行MPM模式 prefork worker event
高并发最好的是event,最差的是prefork
该配置文件是控制三种模型之间的切换的
可以通过调整这三行配置文件进行修改三种模型模式
7.虚拟主机
7.1基于IP地址
[root@node2 conf.d]#vim /etc/httpd/conf.d/test.conf
<VirtualHost 192.168.91.101:80>
ServerAdmin support@jfedu.net
DocumentRoot "/var/www/html/accp"
ServerName www.accp.com
ErrorLog "logs/www.accp.com_error_log"
CustomLog "logs/www.accp.com_access_log" common
</VirtualHost>
<VirtualHost 192.168.91.188:80>
ServerAdmin support@jfedu.net
DocumentRoot "/var/www/html/accp"
ServerName www.accp.com
ServerAlias www.dummy-host.example.com
ErrorLog "logs/www.accp.com_error_log"
CustomLog "logs/www.accp.com_access_log" common
</VirtualHost>
<Directory "/var/www">
AllowOverride None
# Allow open access:
Require all granted
</Directory>
[root@localhost extra]#vim /etc/httpd/conf/httpd.conf
Listen 192.168.91.101:80
Listen 192.168.91.188:80
7.2基于端口地址
[root@node2 conf.d]#vim /etc/httpd/conf.d/test.conf
<VirtualHost 192.168.91.101:80>
ServerAdmin support@jfedu.net
DocumentRoot "/var/www/html/accp"
ServerName www.accp.com
ErrorLog "logs/www.accp.com_error_log"
CustomLog "logs/www.accp.com_access_log" common
</VirtualHost>
<VirtualHost 192.168.91.101:8080>
ServerAdmin support@jfedu.net
DocumentRoot "/var/www/html/accp"
ServerName www.accp.com
ServerAlias www.dummy-host.example.com
ErrorLog "logs/www.accp.com_error_log"
CustomLog "logs/www.accp.com_access_log" common
</VirtualHost>
<Directory "/var/www">
AllowOverride None
# Allow open access:
Require all granted
</Directory>
[root@localhost extra]#vim /etc/httpd/conf/httpd.conf
Listen 192.168.91.101:80
Listen 192.168.91.188:80
7.3基于域名
[root@node2 conf.d]#vim /etc/httpd/conf.d/test.conf
<VirtualHost 192.168.91.101:80>
ServerAdmin support@jfedu.net
DocumentRoot "/var/www/html/kgc"
ServerName www.kgc.com
ErrorLog "logs/www.kgc.com_error_log"
CustomLog "logs/www.kgc.com_access_log" common
</VirtualHost>
<VirtualHost 192.168.91.101:80>
ServerAdmin support@jfedu.net
DocumentRoot "/var/www/html/accp"
ServerName www.accp.com
ServerAlias www.dummy-host.example.com
ErrorLog "logs/www.accp.com_error_log"
CustomLog "logs/www.accp.com_access_log" common
</VirtualHost>
<Directory "/var/www">
AllowOverride None
# Allow open access:
Require all granted
</Directory>
mkdir -p /var/www/html/kgc
mkdir -p /var/www/html/accp
echo "<h1>www.kgc.com</h1>" /var/www/html/kgc/index.html
echo "<h1>www.accp.com</h1>" /var/www/html/accp/index.html
去添加host文件
8.补充
/var/www/html 主站点
/etc/httpd 主目录
四、Cookie和Session
无状态协议是指协议对事物处理没有记忆能力。缺少状态意味着如果后续处理需要前面的信息,则必须重传,这样可能导致每次连接传送的数据量增大。另一方面,在服务器不需要先前信息时它应答就很快。
HTTP是超本文传输协议,顾名思义,这个协议支持超文本的传输。什么是超文本?说白了就是使用HTML编写的页面。通常,我们使用客户端浏览器访问服务器的资源,最常见的URL也是以html为后缀的文件,因此可以说超文本是网络上最主要的资源。
既然HTTP协议的目的是在于支持超文本的传输,也就是资源的传输,那么客户端浏览器向HTTP服务器发送请求,继而HTTP服务器将相信资源发回给客户端这样一个过程中,无论对于客户端还是服务器,都没有必要记录这个过程,因为每一次请求和响应都是相对独立的,一般而言,一个URL对应着一个唯一的超文本,正是因为这样的唯一性,使得记录用户的行为状态变得毫无意义,所以,HTTP协议被设计为无状态的连接协议符合它本身的需求。
HTTP协议这种特性有优点也有缺点,优点在于解放了服务器,每一次请求"点到为止",不会造成不必要的连接占用,缺点在于如果为了保留状态,每次请求都会传输大量的重复信息内容。
可是随着 Web 的不断发展,很多业务都需要对通信状态进行保存.如果是一次性会话的过程: 打开浏览器 -> 访问一些服务器内容 -> 关闭浏览器但目前有很多WEB访问场景,并不是一次性会话,而是多次相关的会话,比如:
-
登录场景:
打开浏览器 -> 浏览到登陆页面 -> 输入用户名和密码 -> 访问到用户主页(显示用户名) -> 修改密码(输入原密码)-> 修改收货地址.......
问题:在此处登录会话过程中产生的数据(用户会话数据)如何保存下来呢?
-
购物场景:
打开浏览器 -> 浏览商品列表 -> 加入购物车(把商品信息保存下来) -> 关闭浏览器打开浏览器-> 直接进入购物车 -> 查看到上次加入购物车的商品 -> 下订单 -> 支付
问题: 在购物会话过程中,如何保存商品信息?
以上场景都需要保留会话数据,需要会话管理机制。
会话管理: 管理浏览器客户端和服务器端之间会话过程中产生的会话数据。
为了会话管理,HTTP就需要传输大量重复信息内容的问题,造成大量的网络带宽消耗。于是 Cookie 和Session 技术闪亮登场了,它们可以为用户进行会话管理,实现保存状态。
1.Cookie
Cookie 又称为"小甜饼”。类型为"小型文本文件”,指某些网站为了辨别用户身份而储存在用户本地终端(Client Side)上的数据(通常经过加密)。由网景公司的前雇员卢·蒙特利在1993年3月发明
因为HTTP协议是无状态的,即服务器不知道用户上一次做了什么,这严重阻碍了交互式Web应用程序的实现。在典型的网上购物场景中,用户浏览了几个页面,买了一盒饼干和两瓶饮料。最后结帐时,由于HTTP的无状态性,不通过额外的手段,服务器并不知道用户到底买了什么,所以Cookie就是用来绕开HTTP的无状态性的"额外手段”之一。服务器可以设置或读取Cookies中包含信息,借此维护用户跟服务器会话中的状态。
在上面的购物场景中,当用户选购了第一项商品,服务器在向用户发送网页的同时,还发送了一段Cookie,记录着那项商品的信息。当用户访问另一个页面,浏览器会把Cookie发送给服务器,于是服务器知道他之前选购了什么。用户继续选购饮料,服务器就在原来那段Cookie里追加新的商品信息。结帐时,服务器读取发送来的Cookie就行了。
Cookie基于HTTP协议,也叫Web Cookie或浏览器Cookie,是服务器发送到用户浏览器并保存在客户端本地的一小块数据,它会在浏览器下次向同一服务器再发起请求时被携带并发送到服务器上。通常,它用于告知服务端两个请求是否来自同一浏览器,如保持用户的登录状态。Cookie使基于无状态的HTTP协议记录稳定的状态信息成为了可能。
第一次请求过程
- 浏览器第一次发送请求时,不会携带任何cookie信息
- 服务器接收到请求之后,发现请求中没有任何cookie信息
- 服务器生成和设置一个cookie.并将此cookie设置通过set_cookie的首部字段保存在响应报文中返回给浏
- 览器
- 浏览器接收到这个响应报文之后,发现里面有cookie信息,浏览器会将cookie信息保存起来
第二次及其之后的过程
- 当浏览器第二次及其之后的请求报文中自动 cookie的首部字段携带第一次响应报文中获取的cookie信息
- 服务器再次接收到请求之后,会发现请求中携带的cookie信息,这样的话就认识是谁发的请求了
- 之后的响应报文中不会再添加set_cookie首部字段
Cookie主要用于以下三个方面:
- 会话状态管理(如用户登录状态、购物车、游戏分数或其它需要记录的信息)
- 个性化设置(如用户自定义设置、主题等)
- 浏览器行为跟踪(如跟踪分析用户行为等)
Cookie 技术通过在请求和响应报文中写入 Cookie 信息来控制客户端的状态。当服务器收到HTTP请求时,服务器可以在响应头里面添加一个Set-Cookie选项。浏览器收到响应后通常会保存下Cookie,之后对该服务器每一次请求中都通过Cookie请求头部将Cookie信息发送给服务器。服务器端发现客户端发送过来的 Cookie 后,会去检查究竟是从哪一个客户端发来的连接请求,然后对比服务器上的记录,最后得到之前的状态信息.另外,Cookie的过期时间、域、路径、有效期、适用站点都可以根据需要来指定。
2.Session
3.Cookie和Session区别
- cookie通常是在服务器生成,但也可以在客户端生成,session是在服务器端生成的
- session 将数据信息保存在服务器端,可以是内存,文件,数据库等多种形式,cookie 将数据保存在客户端的内存或文件中
- 单个cookie保存的数据不能超过4K,每个站点cookie个数有限制,比如IE8为50个、Firefox为50个、Opera为30个;session存储在服务器,没有容量限制
- cookie存放在用户本地,可以被轻松访问和修改,安全性不高;session存储于服务器,比较安全
- cookie有会话cookie和持久cookie,生命周期为浏览器会话期的会话cookie保存在缓存,关闭浏览器窗口就消失,持久cookie被保存在硬盘,知道超过设定的过期时间;随着服务端session存储压力增大,会根据需要定期清理session数据
- session中有众多数据,只将sessionID这一项可以通过cookie发送至客户端进行保留,客户端下次访问时,在请求报文中的cookie会自动携带sessionID,从而和服务器上的的session进行关联
4.Cookie和Session的缺点
4.1Cookie缺点
- 使用cookie来传递信息,随着cookie个数的增多和访问量的增加,它占用的网络带宽也很大,试想假如cookie占用200字节,如果一天的PV有几个亿,那么它要占用多少带宽?
- cookie并不安全,因为cookie是存放在客户端的,所以这些cookie可以被访问到,设置可以通过插件添加、修改cookie。所以从这个角度来说,我们要使用sesssion,session是将数据保存在服务端的,只是通过cookie传递一个sessionId而已,所以session更适合存储用户隐私和重要的数据
4.2Session缺点
- 不容易在多台服务器之间共享,可以使用session绑定,session复制,session共享解决
- session存放在服务器中,所以session如果太多会非常消耗服务器的性能cookie和session各有优缺点,在大型互联网系统中,单独使用cookie和session都是不可行的
5.拓展——如何保持会话连接
方法一 Cookie加Sessionid
方法二 IP hash + url hash
五、Web相关工具
1.Wget
格式
wget [OPTION]... [URL]...
选项 | 含义 |
---|---|
-q | 静默模式 |
-c | 断电续传 |
-P /path | 保存在指定目录 |
-O filename | 保存为指定文件名,filename 为“ - ”时,发送至标准输出 |
--limit-rate | 指定传输速率,单位K,M等 |
[root@localhost ~]#wget --limit-rate 1M -P /data
#指定下载速率为1M 保存指定目录为/data
https://mirrors.aliyun.com/centos/8/isos/x86_64/CentOS-8-x86_64-1905-dvd1.iso
2.curl
curl是基于URL语法在命令行方式下工作的文件传输工具,它支持FTP, FTPS, HTTP, HTTPS, GOPHER, TELNET, DICT, FILE及LDAP等协议。curl支持HTTPS认证,并且支持HTTP的POST、PUT等方法, FTP上传, kerberos认证,HTTP上传,代理服务器,cookies,用户名/密码认证, 下载文件断点续传,上载文件断点续传, http代理服务器管道( proxy tunneling),还支持IPv6,socks5代理服务器,通过http代理服务器上传文件到FTP服务器等,功能十分强大
格式
curl [options] [URL...]
选项 | 含义 |
---|---|
-A/--user-agent <string> | 设置用户代理发送给服务器 |
-e/--refer <URL> | 来源网址 |
--cacert <file> | CA证书(SSL) |
-k/--insecure | 允许忽略证书进行SSL连接 |
--compressed | 要求返回时压缩的格式 |
-H/--header “key:value” | 自定义首部字段传递给服务器 |
-i | 显示页面内容,包括报文首部信息 |
-I/--head | 只显示响应报文首部信息 |
-D/--dump-header <file> | 将url的header信息存放在指定文件中 |
--basic | 使用HTTP基本认证 |
-u/--user <user[:password]> | 设置服务器的用户和密码 |
-L | 如果有3xx响应码,重新发送请求到新位置 |
-O | 使用URL中默认的文件名保存文件导本地 |
-o <file> | 将网络文件保存为指定的文件中 |
--limit-rate <rate> | 设置传输速度 |
-0/--http1.0 | 数字0,使用 HTTP 1.0 |
-v/--verbose | 更详细 |
-C | 选项可对文件使用断电续传功能 |
-c/--cookie-jar <file name> | 将url中Cookie存放在指定文件中 |
-x/--proxy <proxyhost[:port]> | 指定代理服务器地址 |
-X/--request <command> | 向服务器发送指定请求方法 |
-U/--proxy-user <user:password> | 代理服务器用户和密码 |
-T | 选项可将指定的本地文件上传到FTP服务器上 |
--data/-d | 方式指定使用POST方式传递数据 |
-s --silent | Silent mode |
-b name=data | 从服务器响应set-Cookie得到值,返回给服务器 |
-w <format> | 显示响应的指定的报文信息,如:%{http_code},%{remote_ip}等 |
-m,--max-time <time> | 允许最大传输时间 |
163是为了防止使用curl来访问占用流量,所以拒绝curl的访问,因此是403代码
我们可以冒充浏览器访问163Web页面
提取状态码
提远端IP(百度的IP)
提取本地IP
3.压力测试工具——ab(http tools)
httpd的压力测试工具:
-
ab, webbench, http_load, seige
-
Jmeter 开源
-
Loadrunner 商业,有相关认证
-
tcpcopy:网易,复制生产环境中的真实请求,并将之保存
ab 来自httpd-tools包
命令格式
ab [OPTIONS] URL
选项 | 含义 |
---|---|
-n | 总请求数 |
-c | 模拟的并发数 |
-k | 以持久连接模式测试 |