跨Internet的主机间通讯
在建立通信连接的每一端,进程间的传输要有两个标志:
IP地址和端口号,合称为套接字地址 socket address
客户机套接字地址定义了一个唯一的客户进程
服务器套接字地址定义了一个唯一的服务器进程
IP+端口号=套接字(socket address)
Socket Type:根据使用的传输层协议
SOCK_STREAM:流,tcp套接字,可靠地传递、面向连接
SOCK_DGRAM:数据报,udp套接字,不可靠地传递、无连接
SOCK_RAW: 裸套接字,无须tcp或tdp,APP直接通过IP包通信
HTTP协议:超文本传输协议(处理后的文本叫做超文本,早期称呼)
HTML:超文本的标记语言,编程语言
www.w3school.com.cn
提高HTTP连接性能
并行连接:通过多条TCP连接发起并发的HTTP请求
持久连接:keep-alive,长连接,重用TCP连接,以消除连接和关闭的时延,以事务个数和时间来决定是否关闭连接
管道化连接:通过共享TCP连接发起并发的HTTP请求
复用的连接:交替传送请求和响应报文(实验阶段)
URI:统一资源标识
URL:统一资源定位符
URN:统一资源命名
一次完整的http请求处理过程
1、建立连接:接收或拒绝连接请求
2、接收请求:接收客户端请求报文中对某资源的一次请求的过程
Web访问响应模型(Web I/O)
单进程I/O模型:启动一个进程处理用户请求,而且一次只处理一个,多个请求被串行响应
多进程I/O模型(prefork):并行启动多个进程,每个进程响应一个连接请求
复用I/O结构:启动一个进程,同时响应N个连接请求
实现方法:多线程模型和事件驱动
多线程模型:一个进程生成N个线程,每线程响应一个连接请求
事件驱动:一个进程处理N个请求
复用的多进程I/O模型(worker):启动M个进程,每个进程响应N个连接请求,同时接收M*N个请求
3、处理请求:服务器对请求报文进行解析,并获取请求的资源及请求方法等相 关信息,根据方法,资源,首部和可选的主体部分对请求进行处理
4、访问资源: 服务器获取请求报文中请求的资源web服务器,即存放了web资源的服务器, 负责向请求者提供对方请求的静态资源,或动态运行后生成的资源
5、构建响应报文:
一旦Web服务器识别除了资源,就执行请求方法中描述的动作,并返回响应报文。响应报文中 包含有响应状态码、响应首部,如果生成了响应主体的话,还包括响应主体
1)响应实体:如果事务处理产生了响应主体,就将内容放在响应报文中回送过去。响应报文中通常包括:
描述了响应主体MIME类型的Content-Type首部
描述了响应主体长度的Content-Length
实际报文的主体内容
2)URL重定向:web服务构建的响应并非客户端请求的资源,而是资源另外一个访问路
永久重定向:http://www.360buy.com 响应代码:301
临时重定向:http://www.taobao.com 响应代码:302
3)MIME类型:Web服务器要负责确定响应主体的MIME类型。多种配置服务器的方法可将MIME类型与资源管理起来
魔法分类:Apache web服务器可以扫描每个资源的内容,并将其与一个已知模式表(被称为魔法文件)进行匹配,以决定每个文件的MIME类型。这样做可能比较慢,但很方便,尤其是文件没有标准扩展名时
显式分类:可以对Web服务器进行配置,使其不考虑文件的扩展名或内容,强制特定文件或目录内容拥有某个MIME类型
类型协商: 有些Web服务器经过配置,可以以多种文档格式来存储资源。在这种情况下,可以配置Web服务器,使其可以通过与用户的协商来决定使用哪种格式(及相关的MIME类型)"最好"
6、发送响应报文:
Web服务器通过连接发送数据时也会面临与接收数据一样的问题。服务器可能有很多条到各个客户端的连接,有些是空闲的,有些在向服务器发送数据,还有一些在向客户端回送响应数据。服务器要记录连接的状态,还要特别注意对持久连接的处理。对非持久连接而言,服务器应该在发送了整条报文之后,关闭自己这一端的连接。对持久连接来说,连接可能仍保持打开状态,在这种情况下,服务器要正确地计算Content-Length首部,不然客户端就无法知道响应什么时候结束了
7、记录日志:
最后,当事务结束时,Web服务器会在日志文件中添加一个条目,来描述已执行的事务
httpd服务
特性
高度模块化:核心+模块
DSO:动态加/卸载
MPM:多路处理模块
MPM工作模式
prefork:多进程I/O模型,每个进程响应一个请求,默认模型
一个主进程:生成和回收n个子进程,创建套接字,不响应请求
多个子进程:工作work进程,每个子进程处理一个请求;系统初始时,预先生成多个空闲进程,等待请求,最大不超过1024个
worker:复用的多进程I/O模型,多进程多线程,IIS使用此模型
一个主进程:生成m个子进程,每个子进程负责生个n个线程,每个线程响应
一个请求,并发响应请求:m*n
event:事件驱动模型(worker模型的变种)
一个主进程:生成m个子进程,每个进程直接响应n个请求,并发响应请求:m*n,有专门的线程来管理这些keep-alive类型的线程,当有真实请求时,将请求传递给服务线程,执行完毕后,又允许释放。这样增强了高并发场景下的请求处理能力
httpd功能特性
虚拟主机:在一台物理主机上建立多个网站
CGI:通用网关接口
正向代理:离客户端近,有缓存功能
反向代理:离服务端近,有调度功能
负载均衡
路径别名
丰富的用户认证机制
支持第三方模块
httpd配置文件详解
centos7更改HTML目录必须授权
DocumentRoot "PATH"
<Directory "PATH">
Require all granted #授权
</Directory>
配置文件常用注释
ServerRoot "/etc/httpd" #服务所在目录,包括配置文件、模块等
Listen 80 #监听端口
Include conf.modules.d/*.conf #允许配置文件中包含其他配置文件
User apache #该服务的执行用户
Group apache #该服务的执行组
ServerAdmin root@localhost #客户端的错误消息包含该邮箱
<Directory />
AllowOverride none #.htaccess文件无效
Require all denied #访问无条件拒绝
</Directory>
DocumentRoot "/var/www/html" #服务器默认虚拟主机路径
<Directory "/var/www">
AllowOverride None #不写默认为none
Require all granted #访问无条件允许
</Directory>
<Directory "/var/www/html">
Options Indexes FollowSymLinks #遵循此目录中的符号链接
AllowOverride None
Require all granted
</Directory>
<IfModule dir_module>
DirectoryIndex index.html #虚拟主机路径后不添加文件时默认访问该文件
</IfModule>
<Files ".ht*">
Require all denied
</Files>
ErrorLog "logs/error_log" #定义该服务工作目录下的错误日志路径和名称
LogLevel warn #调整错误日志记录中的详细程度和格式定义
<IfModule log_config_module>
LogFormat "%h %l %u %t \"%r\" %>s %b \"%{Referer}i\" \"%{User-Agent}i\"" combined
LogFormat "%h %l %u %t \"%r\" %>s %b" common
<IfModule logio_module>
LogFormat "%h %l %u %t \"%r\" %>s %b \"%{Referer}i\" \"%{User-Agent}i\" %I %O" combi
nedio </IfModule>
CustomLog "logs/access_log" combined #请求记录日志
</IfModule>
<IfModule alias_module>
ScriptAlias /cgi-bin/ "/var/www/cgi-bin/" #别名设置
</IfModule>
<Directory "/var/www/cgi-bin">
AllowOverride None
Options None
Require all granted
</Directory>
<IfModule mime_module>
TypesConfig /etc/mime.types
AddType application/x-compress .Z
AddType application/x-gzip .gz .tgz
AddType text/html .shtml
AddOutputFilter INCLUDES .shtml
</IfModule>
AddDefaultCharset UTF-8
<IfModule mime_magic_module>
MIMEMagicFile conf/magic
</IfModule>
EnableSendfile on #使用内核sendfile支持将文件传递给客户端
IncludeOptional conf.d/*.conf