5.3 实际 Web 服务器工作流程

最新推荐文章于 2023-09-02 16:28:18 发布

gzf6

最新推荐文章于 2023-09-02 16:28:18 发布

阅读量2.2k

点赞数 1

分类专栏： HTTP 5. Web 服务器

本文链接：https://blog.csdn.net/gogzf/article/details/78295868

版权

客户端请求一条到 Web 服务器的 TCP 连接时，Web 服务器会建立连接，判断连接的另一端是哪个客户端，从 TCP 连接中将 IP 地址解析出来。不同的操作系统在对 TCP 连接进行操作时会使用不同的接口和数据结构。在 Unix 环境下，TCP 连接是由一个套接字表示的，可以用 getpeername 调用从套接字中获取客户端的 IP 地址。
一旦新连接建立起来并被接受，服务器就会将新连接添加到其现存 Web 服务器连接列表中，做好监视连接上数据传输的准备。
Web 服务器可以随意拒绝或立即关闭任意一条连接。有些 Web 服务器会因为客户端 IP 地址或主机名是未认证的，或者因为它是已知的恶意客户端而关闭连接。Web 服务器也可以使用其他识别技术。

# 配置 Apache，为 HTML 和 CGI 资源查找主机名
HostnameLookups off
<Files ~ "\.(html|htm|cgi)$">
    HostnameLookups on 
</Files>

有些 Web 服务器还支持 IETF 的 ident 协议。服务器可以通过 ident 协议找到发起 HTTP 连接的用户名。
这些信息对 Web 服务器的日志记录特别有用——流行的通用日志格式(Common Log Format)的第二个字段中就包含了每条 HTTP 请求的 ident 用户名。这个通用日志格式的 ident 字段被称为“rfc931”，这是根据定义 ident 协议的过时 RFC 版本(更新过的 ident 规范记录在 RFC1413 中)命名的。
如果客户端支持 ident 协议，就在 TCP 端口 113 上监听 ident 请求。
ident 协议工作流程：
1. 客户端打开了一条 HTTP 连接。
2. 服务器打开自己到客户端 ident 服务器端口(113)的连接。
3. 服务器发送一条简单的请求，询问与(由客户端和服务器端口号指定的)新连接相对应的用户名。
4. 从客户端解析出包含用户名的响应。
ident 在组织内部可以很好地工作，但在公共因特网上并不能很好地工作，原因包括:
- 很多客户端 PC 没有运行 ident 识别协议守护进程软件;
- ident 协议会使 HTTP 事务处理产生严重的时延;
- 很多防火墙不允许 ident 流量进入;
- ident 协议不安全，容易被伪造;
- ident 协议也不支持虚拟 IP 地址;
- 暴露客户端的用户名还涉及隐私问题。
可以通过 Apache 的 IdentityCheck on 指令告知 Apache Web 服务器使用 ident 查找功能。如果没有 ident 信息可用，Apache 会用连字

关注