HTTP协议
http协议 作用在于 扩展 网络通信,两台主机之间通信
yum install nc -y
[root@localhost ~]#nc -l 8000
#主机1 在监听 8000 端口
[root@node2 ~]#nc 192.168.91.100 8000
http 相关概念
-
互联网:是网络的网络,是所有类型网络的母集
-
因特网:世界上最大的互联网网络。即因特网概念从属于互联网概念。习惯上,大家把连接在因特网上的计算机都成为主机。
-
万维网:WWW(world wide web)万维网并非某种特殊的计算机网络,是一个大规模的、联机式的信息贮藏库,使用链接的方法能非常方便地从因特网上的一个站点访问另一个站点(超链技术),具有提供分布式服务的特点。万维网是一个分布式的超媒体系统,是超文本系统的扩充,基于B/S架构实现
-
URL: 万维网使用统一资源定位符(Uniform Resource Locator)来标志万维网上的各种文档,并使每个文档在整个因特网的范围内具有唯一的标识符URL。
-
HTTP:即超文本传送协议(HyperText Transfer Protocol)。HTTP是处于应用层的协议,使用TCP传输层协议进行可靠的传送。
-
HTML: 使得万维网页面的设计者可以很方便地用链接从页面的某处链接到因特网的任何一个万维网页面,并且能够在自己的主机品目上将这些页面显示出来。
http 协议通信过程
由客户端向于应用层发送http保温,于传输层为其添加默认的tcp头部,再于网络层为其添加ip头部,再于数据链路层为报文添加mac头部
再由对方硬件接收,并按照上述反向推进。一层层拆解,最终成功访问资源
HTTP 相关技术
http: Hyper Text Transfer Protocol 默认端口: 80/tcp
-
html
-
css
-
javascript
html
超文本标记语言,编程语言,主要负责实现页面的结构
CSS
为其进行美化操作,定义了如何显示(装扮) HTML 元素,比如:字体大小和颜色属性等。
javascript
实现网页的动画效果,但实属于静态资源
java 与 javascript 无关 犹如 周杰 和 周杰伦 在不同的领域发光发热
MIME
MIME : Multipurpose Internet Mail Extensions 多用途互联网邮件扩展
文件 /etc/mime.types ,来自于mailcap包
MIME格式:type/subtype 主要类型/次要类型
URI(i) 和 URL uri
URN:Uniform Resource Naming,统一资源命名
URL:Uniform Resorce Locator,统一资源定位符,用于描述某服务器某特定资源位置
URN如同一个人的名称,而URL代表一个人的住址。换言之,URN定义某事物的身份,而URL提供查找该事物的方法。
URL示例
http://www.kgc.com:80/images/logo.jpg
提供 http服务软件的根 不是操作系统真正的根 /var/www/html
网站访问量
IP(独立IP):即Internet Protocol,指独立IP数。 一天内来自相同客户机IP 地址只计算一次,记录远程客户机IP地址的计算机访问网站的次数
PV(访问量): 即Page View , 用户每次刷新即被计算一次,PV反映的是浏览某网站的页面数,PV与来访者的数量成正比,PV并不是页面的来访者数量,而是网站被访问的页面数量
UV(独立访客):即Unique Visitor,访问网站的一台电脑为一个访客。 可以理解成访问某网站的电脑的数量。网站判断来访电脑的身份是通过cookies实现的。 如果更换了IP后但不清除cookies,再访问相同网站,该网站的统计中UV数是不变的
HTTP工作机制\
一次http事务包括: http请求 : http request
http响应 : http reponse
Web资源:web resource,由多个众多资源文件构成 打开页面会有多个资源展示,一个wab通常不是单个资源 他会是一组资源的集合。
资源类型
静态资源 无需服务器做出额外处理 直接调用出来就能
常见静态文件后缀:.html, .txt, .jpg, .js, .css, .mp3, .avi
动态文件:需要经过服务端执行程序 返回执行结果 服务器端和客户端的内容不相同
常见动态文件后缀:.php, .jsp ,asp
HTTP连接请求
串行和并行连接
客户端每次从服务端获取资源都要,
串行,持久连接和管道
提高HTTP连接性能
-
并行连接:通过多条TCP连接发起并发的HTTP请求
-
持久连接:keep-alive,重用TCP连接,以消除连接和关闭的时延,以事务个数和时间来决定是否关闭连接
-
管道化连接:通过共享TCP连接,发起并发的HTTP请求
-
复用的连接:交替传送请求和响应报文(实验阶段)
HTTP 协议版本
http/0.9**:**
991,原型版本,功能简陋,只有一个命令GET。无下载功能。
http/1.0
支持cache, MIME, method 支持文件下载
每个TCP连接只能发送一个请求,发送数据完毕,连接就关闭,如果还要请求其他资源,就必须再新建一个连接引入了POST命令和HEAD命令头信息是 ASCII 码,后面数据可为任何格式。
http/1.1
支持长连接即TCP连接默认不关闭,可以被多个请求复用,不用声明Connection: keep-alive。
对于同一个域名,大多数浏览器允许同时建立6个持久连接引入了管道机制,即在同一个TCP连接里,客户端可以同时发送多个请求,进一步改进了HTTP协议的效率新增方法:PUT、PATCH、OPTIONS、DELETE同一个TCP连接里,所有的数据通信是按次序进行的。
HTTP1.0和HTTP1.1的区别
缓存处理,在HTTP1.0中主要使用header里的If-Modified-Since,Expires来做为缓存判断的标准。
带宽优化及网络连接的使用 1.1对比1.0 减少了带宽浪费现象,通过在请求同总加入一个range头域 他允许只访问资源的某一部分
错误通知的管理 新增24个状态响应码
409(Conflict)表示请求的资源与资源当前状态冲突
410(Gone)表示服务器上的某个资源被永久性的删除
Host 头处理 在HTTP1.0中认为每台服务器都绑定一个唯一的IP地址, 因此,请求消息中的URL并没有传递主机名(hostname)。
长连接 在一个TCP连接上可以传送多个HTTP请求和响应,减少了建立和关闭连接的消耗和延迟。
HTTP1.0和1.1的问题
HTTP1.x在传输数据时,每次都需要重新建立连接,对时间的消耗 和对硬件资源的占用都很大 在移动端尤为突出。
HTTP1.x在传输数据时,所有传输的内容都是明文 无法保证数据的安全性
HTTP1.x在使用时,header里携带的内容过大,增加了传输的成本,并且每次请求header基本不怎么变化,尤其在移动端增加用户流量
虽然HTTP1.x支持了keep-alive,来弥补多次创建连接产生的延迟,但是keep-alive使用多了同样会给服务端带来大量的性能压力,并且对于单个文件被不断请求的服务(例如图片存放网站),keep alive可能会极大的影响性能 因为它在文件被请求之后还保持了不必要的连接很长时间
HTTPS协议
-
HTTPS协议需要到CA申请证书,一般免费证书很少,需要交费
-
HTTP协议运行在TCP之上,所有传输的内容都是明文,HTTPS运行在SSL/TLS之上,SSL/TLS运行在TCP之上,所有传输的内容都经过加密的
-
HTTP和HTTPS使用的是不同的连接方式,端口不同,前者是80,后者是443
-
HTTPS可以有效的防止运营商劫持,解决了防劫持的一个大问题
-
HTTPS 实现过程降低用户访问速度,但经过合理优化和部署,HTTPS 对速度的影响还是可以接受的
HTTP 请求访问的完整过程
-
建立连接
-
接收请求
-
处理请求
-
访问资源
-
构建响应报文
-
发送响应报文
-
记录日志
建立连接:
接收或拒绝连接请求
接收请求:
接收客户端请求报文中对某资源的一次请求的过程
-
单进程I/O模型:每次收哦i
-
多进程I/O模型:并行启动多个进程,每个进程响应一个连接请求
-
复用I/O结构:启动一个进程,同时响应N个连接请求
-
复用的多进程I/O模型:启动M个进程,每个进程响应N个连接请求,同时接收M*N个请求
处理请求:
服务器对请求报文进行解析,并获取请求的资源及请求方法等相关信息,根据方法,资源,首部和可选的主体部分对请求进行处理
访问资源:
服务器获取请求报文中请求的资源web服务器,即存放了web资源的服务器,负责向请求者提供对方请求的静态资源,或动态运行后生成的资源
构建响应报文:
响应报文中 包含有响应状态码、响应首部,如果生成了响应主体的话,还包括响应主体
发送响应报文
服务器可能有很多条到各个客户端的连接,有些是空闲的,有些在向服务器发送数据,还有一些在向客户端回送响应数据。服务器要记录连接的状态,还要特别注意对持久连接的处理。
记录日志
状态码
http协议状态码分类
1xx:100-101 信息提示
2xx:200-206 成功
3xx:300-307 重定向
4xx:400-415 错误类信息,客户端错误
5xx:500-505 错误类信息,服务器端错误
http协议常用的状态码
200: 成功,请求数据通过响应报文的entity-body部分发送;OK
301: 请求的URL指向的资源已经被删除;但在响应报文中通过首部Location指明了资源现在所处的新位置;Moved Permanently
302: 响应报文Location指明资源临时新位置 Moved Temporarily
304: 客户端发出了条件式请求,但服务器上的资源未曾发生改变,则通过响应此响应状态码通知客户端;Not Modified
307: 浏览器内部重定向
401: 需要输入账号和密码认证方能访问资源;Unauthorized
403: 请求被禁止;Forbidden
404: 服务器无法找到客户端请求的资源;Not Found
500: 服务器内部错误;Internal Server Error,比如:cgi程序没有执行权限
502: 代理服务器从后端服务器收到了一条伪响应,如无法连接到网关;Bad Gateway
503: 服务不可用,临时服务器维护或过载,服务器无法处理请求,比如:php服务停止,无法处理php程序
504: 网关超时
MPM multi-processing module 工作模式
prefork:CentOS 7 httpd默认模型一个主进程:生成和回收n个子进程,创建套接字,不响应请求多个子进程:工作 work进程,每个子进程处理一个请求;系统初始时,预先生成多个空闲进程,等待请求 一个进程响应一个请求
优点:稳定
缺点:慢,占用资源,不适用于高并发场景
worker: 一个主进程:生成m个子进程,每个子进程负责生个n个线程,每个线程响应一个请求,并发响应请求:m*n
有一个控制进程,启动多个子进程,每个子进程里面包含固定的线程,使用线程程来处理请求,当线程不够使用的时候会再启动一个新的子进程,然后在进程里面再启动线程处理请求,
优点:相比prefork 占用的内存较少,可以同时处理更多的请求
缺点:使用keep-alive的长连接方式,某个线程会一直被占据,即使没有传输数据,也需要一直等待到超时才会被释放。如果过多的线程,被这样占据,也会导致在高并发场景下的无服务线程可用。(该问题在prefork模式下,同样会发生)
event:事件驱动模型 一个主进程:生成m个子进程,每个子进程负责生个n个线程,每个线程响应一个请求,并发响应请求:m*n,有专门的监控线程来管理这些keep-alive类型的线程,当有真实请求时,将请求传递给服务线程,执行完毕后,又允许释放。这样增强了高并发场景下的请求处理能力
优点:单线程响应多请求,占据更少的内存,高并发下表现更优秀,会有一个专门的线程来管理keep-alive类型的线程,当有真实请求过来的时候,将请求传递给服务线程,执行完毕后,又允许它释放
缺点:没有线程安全控制
Httpd 安装和相关文件
包安装httpd
-
包安装: centos发行版,稳定,建议使用
-
编译:定制或特殊需求
范例:
yum install httpd -y
或编译安装
获取包后于包内
./configern
make -j2
make install
相关配置文件
/etc/httpd/conf/httpd.conf 主配置文件
/etc/http/conf.d/*.conf 子配置文件
/etc/httpd/conf.d/conf.modules/ 模块加载配置文件
检查配置语法:httpd -t 或 apache2 -t
可加入system控制模块于
-
/usr/lib/systemd/system/httpd.service
-
配置文件:/etc/sysconfig/httpd
- systemctl enable|disable httpd.service
- systemctl {start|stop|restart|status|reload} httpd.service
- apachectl start|stop|restart|configtest
- service httpd start|stop|restart|configtest
模块文件路径:
-
/etc/httpd/modules
-
/usr/lib64/httpd/modules
指定服务器名
[root@centos7 ~]#httpd -t
AH00558: httpd: Could not reliably determine the server's fully qualified domain
name, using centos7.localdomain. Set the 'ServerName' directive globally to
suppress this message
Syntax OK
[root@centos7 ~]#vim /etc/httpd/conf/httpd.conf
#ServerName www.example.com:80
servername www.magedu.org
[root@centos7 ~]#httpd -t
Syntax OK
隐藏服务器版本信息
[root@localhost ~]#curl -I 192.168.91.101
HTTP/1.1 200 OK
Date: Sat, 19 Aug 2023 08:28:41 GMT
Server: Apache/2.4.6 (CentOS)
Last-Modified: Fri, 18 Aug 2023 04:04:43 GMT
ETag: "1c-6032aa0ec1dcc"
Accept-Ranges: bytes
Content-Length: 28
Content-Type: text/html; charset=UTF-8
范例
[root@node2 httpd]#vim conf.d/test.conf
Listen 8080
ServerTokens Prod
[root@localhost ~]#curl -I 192.168.91.101
HTTP/1.1 200 OK
Date: Sat, 19 Aug 2023 08:28:41 GMT
Server: Apache
Last-Modified: Fri, 18 Aug 2023 04:04:43 GMT
ETag: "1c-6032aa0ec1dcc"
Accept-Ranges: bytes
Content-Length: 28
Content-Type: text/html; charset=UTF-8
持久连接
Persistent Connection:连接建立,每个资源获取完成后不会断开连接,而是继续等待其它的请求完成,默认开启持久连接
断开条件:
-
时间限制:以秒为单位, 默认5s,httpd-2.4 支持毫秒级
-
请求数量: 请求数达到指定值,也会断开
-
副作用:对并发访问量大的服务器,持久连接会使有些请求得不到响应
折衷:使用较短的持久连接时间
持久连接相关指令:
KeepAlive On|Off
KeepAliveTimeout 15 #连接持续15s,可以以ms为单位,默认值为5s
MaxKeepAliveRequests 500 #持久连接最大接收的请求数,默认值100
Cookie
指某些网站为了辨别用户身份而储存在用户本地终端(Client Side)上的数据
因为HTTP协议是无状态的,即服务器不知道用户上一次做了什么,这严重阻碍了交互式Web应用程序的实现。
是服务器发送到用户浏览器并保存在客户端本地的一小块数据,
它会在浏览器下次向同一服务器再发起请求时被携带并发送到服务器上。
Cookie主要用于以下三个方面:
-
会话状态管理(如用户登录状态、购物车、游戏分数或其它需要记录的信息)
-
个性化设置(如用户自定义设置、主题等)
-
浏览器行为跟踪(如跟踪分析用户行为等)