Linux 第77天 http其它配置

时间: 20181019


目录

status页面

反向代理功能

Sendfile

http协议:stateless 无状态

报文语法格式

http协议状态码分类

HTTP 首部字段

首部的分类

Cookie

Set-Cookie首部字段

curl工具

httpd自带的工具程序

httpd的压力测试工具

APR



status页面

当访问/server-status目录时会显示httpd状态

LoadModule  status_module  modules/mod_status.so

<Location /server-status>

SetHandler server-status

Order allow,deny

Allow from 172.16

</Location>


反向代理功能

启用反向代理

ProxyPass "/" "http://www.example.com/"

ProxyPa***everse "/" "http://www.example.com/"

特定URL反向代理

ProxyPass "/images" "http://www.example.com/"

ProxyPa***everse "/images" http://www.example.com/

示例:

<VirtualHost *>

ServerName www.winthcloud.com

ProxyPass / http://localhost:8080/

ProxyPa***everse / http://localhost:8080/

</VirtualHost>


DirectoryIndex index.php


<VirtualHost *:80>

ServerName www.b.net

DocumentRoot /apps/vhosts/b.net

ProxyRequests Off

ProxyPassMatch ^/(.*\.php)$  fcgi://127.0.0.1:9000/apps/vhosts/b.net/$1


<Directory "/apps/vhosts/b.net">

Options None

AllowOverride None

Require all granted

</Directory>

</VirtualHost>



反向代理

负责协助处理请求

正向代理

负责提交请求



Sendfile


不用 sendfile 的传统网络传输过程:

read(file, tmp_buf, len)

write(socket, tmp_buf, len)

硬盘 >> kernel buffer >> user buffer >> kernel socket buffer >> 协议栈

一般网络应用通过读硬盘数据,写数据到 socket 来完成网络传输,底层执行过程:

1 系统调用 read() 产生一个上下文切换:从 user mode 切换到 kernel mode,然后 DMA 执

行拷贝,把文件数据从硬盘读到一个 kernel buffer 里。

2 数据从 kernel buffer 拷贝到 user buffer,然后系统调用 read() 

返回,这时又产生一个上下文切换:从kernel mode 切换到 user mode

3 系统调用 write() 产生一个上下文切换:从 user mode 切换到 kernel mode

然后把步骤2读到 user buffer 的数据拷贝到 kernel buffer(数据第2次拷贝到

kernel buffer),不过这次是不同的 kernel buffer,这个 buffer和 socket 相关联。

4 系统调用 write() 返回,产生一个上下文切换:从 kernel mode 切换到 user mode

(第4次切换),然后DMA从 kernel buffer 拷贝数据到协议栈(第4次拷贝)

上面4个步骤有4次上下文切换,有4次拷贝,如能减少切换次数和拷贝次数将会有效

提升性能


Sendfile工作机制

在kernel 2.0+ 版本中,系统调用 sendfile() 就是用来简化上面步骤提升

性能的。sendfile() 不但能减少切换次数而且还能减少拷贝次数

用 sendfile() 来进行网络传输的过程:

sendfile(socket, file, len);

硬盘 >> kernel buffer (快速拷贝到kernel socket buffer) >> 协议栈

1 系统调用 sendfile() 通过 DMA 把硬盘数据拷贝到 kernel buffer,然后

数据被 kernel 直接拷贝到另外一个与 socket 相关的 kernel buffer。这里

没有 user mode 和 kernel mode 之间的切换,在 kernel 中直接完成了从

一个 buffer 到另一个 buffer 的拷贝

2 DMA 把数据从 kernel buffer 直接拷贝给协议栈,没有切换,也不需

要数据从 user mode 拷贝到 kernel mode,因为数据就在 kernel 里


http协议:stateless 无状态

服务器无法持续追踪访问者来源

解决http协议无状态方法

cookie 客户端存放

session 服务端存放

http事务:一次访问的过程

请求:request

响应:response



报文语法格式:

request报文

<method> <request-URL> <version>

<headers>

<entity-body>

response报文

<version> <status> <reason-phrase>

<headers>

<entity-body>

<method>: 请求方法,标明客户端希望服务器对资源执行的动作GET、HEAD、POST等

Method 方法:

GET: 从服务器获取一个资源

HEAD: 只从服务器获取文档的响应首部

POST: 向服务器输入数据,通常会再由网关程序继续处理

PUT: 将请求的主体部分存储在服务器中,如上传文件

DELETE: 请求删除服务器上指定的文档

TRACE: 追踪请求到达服务器中间经过的代理服务器

OPTIONS:请求服务器返回对指定资源支持使用的请求方法

<version>:

HTTP/<major>.<minor>

<status>:

三位数字,如200,301, 302, 404, 502; 标记请求处理过程中发生的情况

<reason-phrase>:

状态码所标记的状态的简要描述

<headers>:

每个请求或响应报文可包含任意个首部;每个首部都有首部名称,后面

跟一个冒号,而后跟一个可选空格,接着是一个值

<entity-body>:请求时附加的数据或响应时附加的数据

协议查看或分析的工具:

tcpdump, wireshark,tshark


http协议状态码分类

status(状态码):

1xx:100-101 信息提示

2xx:200-206 成功

3xx:300-305 重定向

4xx:400-415 错误类信息,客户端错误

5xx:500-505 错误类信息,服务器端错误


200: 成功,请求数据通过响应报文的entity-body部分发送;OK

301: 请求的URL指向的资源已经被删除;但在响应报文中通过首部Location指明了资源现

在所处的新位置;Moved Permanently

302: 响应报文Location指明资源临时新位置 Moved Temporarily

304: 客户端发出了条件式请求,但服务器上的资源未曾发生改变,则通过响应此响应状态

码通知客户端;Not Modified

401: 需要输入账号和密码认证方能访问资源;Unauthorized

403: 请求被禁止;Forbidden

404: 服务器无法找到客户端请求的资源;Not Found

500: 服务器内部错误;Internal Server Error

502: 代理服务器从后端服务器收到了一条伪响应,如无法连接到网关;Bad Gateway

503: 服务不可用,临时服务器维护或过载,服务器无法处理请求

504: 网关超时


HTTP 首部字段


HTTP 首部字段包含的信息最为丰富。首部字段同时存在于请求和响应

报文内,并涵盖 HTTP 报文相关的内容信息。使用首部字段是为了给

客服端和服务器端提供报文主体大小、所使用的语言、认证信息等内容

首部字段结构HTTP 首部字段是由首部字段名和字段值构成的,中间用冒号“:”分隔

字段值对应单个 HTTP 首部字段可以有多个值

报文首部中出现了两个或以上具有相同首部字段名的首部字段时,在规范内尚未明确,

根据浏览器内部处理逻辑的不同,优先处理的顺序可能不同,结果可能并不一致


首部的分类

通用首部:请求报文和响应报文两方都会使用的首部

请求首部:从客户端向服务器端发送请求报文时使用的首部。补充了请求的附加

内容、客户端信息、请求内容相关优先级等信息

响应首部:从服务器端向客户端返回响应报文时使用的首部。补充了响应的附

加内容,也会要求客户端附加额外的内容信息

实体首部:针对请求报文和响应报文的实体部分使用的首部。补充了资源内容

更新时间等与实体有关的的信息

扩展首部


通用首部:

Date: 报文的创建时间

Connection:连接状态,如keep-alive, close

Via:显示报文经过的中间节点(代理,网关)

Cache-Control:控制缓存,如缓存时长

MIME-Version:发送端使用的MIME版本

Warning:错误通知


请求首部:

Accept:通知服务器自己可接受的媒体类型

Accept-Charset: 客户端可接受的字符集

Accept-Encoding:客户端可接受编码格式,如gzip

Accept-Language:客户端可接受的语言

Client-IP: 请求的客户端IP

Host: 请求的服务器名称和端口号

Referer:跳转至当前URI的前一个URL

User-Agent:客户端代理,浏览器版本


条件式请求首部:

Expect:允许客户端列出某请求所要求的服务器行为

If-Modified-Since:自从指定的时间之后,请求的资源是否发生过修改

If-Unmodified-Since:与上面相反

If-None-Match:本地缓存中存储的文档的ETag标签是否与服务器文档

的Etag不匹配

If-Match:与上面相反

安全请求首部:

Authorization:向服务器发送认证信息,如账号和密码

Cookie: 客户端向服务器发送cookie

代理请求首部:

Proxy-Authorization: 向代理服务器认证


响应首部:

信息性:

Age:从最初创建开始,响应持续时长

Server:服务器程序软件名称和版本

协商首部:某资源有多种表示方法时使用

Accept-Ranges:服务器可接受的请求范围类型

Vary:服务器查看的其它首部列表

安全响应首部:

Set-Cookie:向客户端设置cookie

WWW-Authenticate:来自服务器对客户端的质询列表


实体首部:

Allow: 列出对此资源实体可使用的请求方法

Location:告诉客户端真正的实体位于何处

Content-Encoding:对主体执行的编码

Content-Language:理解主体时最适合的语言

Content-Length: 主体的长度

Content-Location: 实体真正所处位置

Content-Type:主体的对象类型,如text

缓存相关:

ETag:实体的扩展标签

Expires:实体的过期时间

Last-Modified:最后一次修改的时间



Cookie

HTTP 是一种无状态协议。协议自身不对请求和响应之间的通信状态进行保存。也就是

说在 HTTP 这个级别,协议对于发送过的请求或响应都不做持久化处理。这是为了更

快地处理大量事务,确保协议的可伸缩性,而特意把 HTTP 协议设计成如此简单的。

可是随着 Web 的不断发展,很多业务都需要对通信状态进行保存。于是引入了 Cookie 

技术。使用 Cookie 的状态管理Cookie 技术通过在请求和响应报文中写入Cookie 

信息来控制客户端的状态。Cookie 会根据从服务器端发送的响应报文内的一个叫做 

Set-Cookie 的首部字段信息,通知客户端保存Cookie。当下次客户端再往该服务器发

送请求时,客户端会自动在请求报文中加入 Cookie 值后发送出去。服务器端发现客户

端发送过来的Cookie 后,会去检查究竟是从哪一个客户端发来的连接请求,然后对

比服务器上的记录,最后得到之前的状态信息


Set-Cookie首部字段


Set-cookie首部字段示例:

Set-Cookie: status=enable; expires=Fri, 24 Nov 2017 20:30:02 GMT;

path=/;


NAME=VALUE赋予 Cookie 的名称和其值,此为必需项

expires=DATE Cookie 的有效期,若不明确指定则默认为浏览器关闭前为止

path=PATH 将服务器上的文件目录作为Cookie的适用对象,若不指定则默认为文档

所在的文件目录


domain=域名作为 Cookie 适用对象的域名,若不指定则默认为创建

Cookie的服务器的域名

Secure 仅在 HTTPS 安全通信时才会发送 Cookie

HttpOnly 加以限制使 Cookie 不能被 JavaScript 脚本访问


curl工具

curl是基于URL语法在命令行方式下工作的文件传输工具,它支持FTP,FTPS, HTTP, 

HTTPS, GOPHER, TELNET, DICT, FILE及LDAP等协议。curl支持HTTPS认证,

并且支持HTTP的POST、PUT等方法, FTP上传, kerberos认证,HTTP上传,代理服务器,

cookies,用户名/密码认证, 下载文件断点续传,上载文件断点续传, http代理服务器

管道(proxy tunneling),还支持IPv6,socks5代理服务器,通过http代理服务

器上传文件到FTP服务器等,功能十分强大


curl [options] [URL...]

-A/--user-agent <string> 设置用户代理发送给服务器

-e/--referer <URL> 来源网址

--cacert <file> CA证书 (SSL)

-k/--insecure 允许忽略证书进行 SSL 连接

--compressed 要求返回是压缩的格式

-H/--header <line>自定义首部信息传递给服务器

-i 显示页面内容,包括报文首部信息

-I/--head 只显示响应报文首部信息

-D/--dump-header <file>将url的header信息存放在指定文件中

--basic 使用HTTP基本认证

-u/--user <user[:password]>设置服务器的用户和密码

-L 如果有3xx响应码,重新发请求到新位置

-O 使用URL中默认的文件名保存文件到本地

-o <file> 将网络文件保存为指定的文件中

--limit-rate <rate> 设置传输速度

-0/--http1.0 数字0,使用HTTP 1.0

-C 选项可对文件使用断点续传功能

-c/--cookie-jar <file name> 将url中cookie存放在指定文件中

-x/--proxy <proxyhost[:port]> 指定代理服务器地址

-X/--request <command> 向服务器发送指定请求方法

-U/--proxy-user <user:password> 代理服务器用户和密码

-T 选项可将指定的本地文件上传到FTP服务器上

--data/-d 方式指定使用POST方式传递数据

-b name=data 从服务器响应set-cookie得到值,返回给服务器


httpd自带的工具程序

htpasswd:basic认证基于文件实现时,用到的账号密码文件生成工具

apachectl:httpd自带的服务控制脚本,支持start和stop

rotatelogs:日志滚动工具



httpd的压力测试工具

ab, webbench, http_load, seige

Jmeter 开源

Loadrunner 商业,有相关认证

tcpcopy:网易,复制生产环境中的真实请求,并将之保存

ab [OPTIONS] URL

来自httpd-tools包

-n:总请求数

-c:模拟的并行数

-k:以持久连接模式测试

ulimit –n # 调整能打开的文件数



APR

APR(Apache portable Run-time libraries,Apache可移植运行库) 主要为上层的

应用程序提供一个可以跨越多操作系统平台使用的底层支持接口库。在早期的Apache版本

中,应用程序本身必须能够处理各种具体操作系统平台的细节,并针对不同的平台调用

不同的处理函数


随着Apache的进一步开发,Apache组织决定将这些通用的函数独立出来并发展成为一个新

的项目。这样,APR的开发就从Apache中独立出来,Apache仅仅是使用 APR而已。目前APR

主要还是由Apache使用,由于APR的较好的移植性,因此一些需要进行移植的C程序也开始

使用APR,开源项目比如用于服务器压力测试的Flood loader tester,该项目不仅仅适用

于Apache,http://httpd.apache.org/test/flood