WHAT - HTTP keep-alive 持久性连接和内存泄漏问题

最新推荐文章于 2024-12-24 17:35:14 发布

@PHARAOH

最新推荐文章于 2024-12-24 17:35:14 发布

阅读量1.5k

点赞数 16

分类专栏：前端网络学习专栏文章标签： http 网络协议网络

本文链接：https://blog.csdn.net/weixin_58540586/article/details/139864700

版权

前端网络学习专栏专栏收录该内容

9 篇文章

订阅专栏

一、介绍

HTTP 持久性连接（persistent connection）

在 WHAT - 计算机网络系列（二）中我们简单介绍过持久性连接。

HTTP 持久性连接（persistent connection）是一种允许在一个 TCP 连接上进行多个 HTTP 请求-响应对的技术。这种技术在 HTTP/1.1 版本中被默认启用。

在持久性连接中，客户端和服务器之间的 TCP 连接在多个请求和响应之间保持打开状态，而不是在每次请求后关闭。这样做有几个优点：

减少延迟：避免了为每个请求重新建立连接所带来的额外延迟。
降低开销：减少了连接建立和断开的开销，包括握手过程和资源分配。
更高的吞吐量：允许在同一个连接上连续发送多个请求，从而提高了数据传输效率。

实现细节

HTTP/1.0：默认情况下不支持持久性连接，但可以通过 Connection: keep-alive 头部来启用。
HTTP/1.1：默认支持持久性连接，除非明确使用 Connection: close 头部来关闭连接。

示例

在 HTTP/1.1 中，一个典型的持久性连接请求和响应头可能如下所示：

请求头：

GET /index.html HTTP/1.1
Host: www.example.com
Connection: keep-alive

响应头：

HTTP/1.1 200 OK
Content-Type: text/html
Connection: keep-alive

在这种情况下，客户端和服务器之间的 TCP 连接会在处理完这个请求和响应后保持打开状态，以便处理后续的请求。

持久性连接的优化

管道化（Pipelining）

也称为流水机制的持久性连接，这也是 HTTP/1.1 的默认选项。在持久性连接的基础上，客户端可以在收到第一个响应之前发送多个请求。这种方式可以进一步减少延迟和提升效率。

对比：

非持久性连接的一次连接的响应时间：2RTT+文件传输时间

发起、建立 tcp 连接：1rtt
发送 http 请求到 http 响应消息的前几个字节到达客户端：1rtt
响应信息中所包含的文件/对象传输给客户端的时间

所以，如果有 n 个资源，需要消耗 n * (2 * rtt + 文件传输时间)

无流水的持久性连接

客户端只有收到前一个响应后才能发送新的请求，这样一个资源耗时一个 rtt。

所以，如果有 n 个资源，需要消耗 (2 * rtt) + (n * rtt)

流水机制的持久性连接

客户端只要遇到一个对象资源就尽快发出请求，理想情况下，收到所有的对象资源只需要消耗 1 个rtt。

所以，如果有 n 个资源，需要消耗 (2 * rtt) + (1 * rtt)

HTTP/2 和 HTTP/3

在这些新版本的 HTTP 协议中，持久性连接得到了更好的优化。例如，HTTP/2 使用多路复用（multiplexing）技术，在一个连接中并发处理多个请求和响应。

持久性连接是现代 Web 性能优化的重要组成部分，有助于提高网页加载速度和资源利用效率。

二、Node.js HTTP Agent 开启 keepAlive 导致的内存泄漏问题

Node 内部的 HTTP Agent 有 Socket 池的设计，因此需要根据对应的业务场景决定是否开启 keepAlive。

这句话的意思是，Node.js 内置的 HTTP Agent 具有管理 Socket 连接池的功能，支持在多个 HTTP 请求之间重用这些连接（即支持持久性连接）。

至于是否开启 keepAlive 选项需要根据具体的业务场景来决定，是因为不合理的配置可能会出现内存泄漏问题。

以下是对这句话的详细解释和理解：

Node.js HTTP Agent 和 Socket 池

在 Node.js 中，HTTP Agent 是用于管理和复用 TCP 连接的模块。它通过维护一个 Socket 池来优化 HTTP 请求的性能。

Socket 池的存在使得 HTTP Agent 可以在多个请求之间重用 TCP 连接，从而避免了频繁建立和关闭连接的开销。

Keep-Alive 选项

keepAlive 是 HTTP Agent 的一个选项，用于控制是否启用持久性连接。当 keepAlive 选项设置为 true 时，HTTP Agent 会在处理完一个请求后保持连接打开，以便后续的请求可以重用该连接。

根据业务场景决定是否开启 Keep-Alive

是否启用 keepAlive 选项取决于你的业务场景和需求：

高频率短时请求：

如果你的应用程序需要频繁地向同一服务器发送请求，启用 keepAlive 可以显著提高性能，减少延迟和资源消耗。

低频率长时请求：

如果你的请求频率较低，或者每个请求的间隔时间较长，启用 keepAlive 可能导致服务器和客户端都保持不必要的连接，从而浪费资源。在这种情况下，禁用 keepAlive 可能更合适。

负载均衡和连接管理：

在某些负载均衡场景下，频繁的连接复用可能会影响负载均衡策略。根据你的负载均衡器和架构设计，可能需要调整 keepAlive 选项。

示例代码

以下是一个使用 keepAlive 选项的示例代码：

const http = require('http');

// 创建一个 HTTP Agent，启用 keepAlive
const agent = new http.Agent({ keepAlive: true });

const options = {
  hostname: 'www.example.com',
  port: 80,
  path: '/',
  method: 'GET',
  agent: agent
};

const req = http.request(options, (res) => {
  console.log(`STATUS: ${res.statusCode}`);
  res.setEncoding('utf8');
  res.on('data', (chunk) => {
    console.log(`BODY: ${chunk}`);
  });
  res.on('end', () => {
    console.log('No more data in response.');
  });
});

req.on('error', (e) => {
  console.error(`Problem with request: ${e.message}`);
});

req.end();

在这个例子中，我们创建了一个 HTTP Agent 并启用了 keepAlive 选项，然后使用这个 Agent 发起 HTTP 请求。根据具体的业务场景，你可以调整 keepAlive 的设置，以优化你的应用程序的性能和资源使用。

在 Node.js 中使用 HTTP Agent 并启用 keepAlive 选项确实可能引发内存泄漏问题。内存泄漏的原因通常是由于未正确管理和清理长时间保持的连接。以下是一些可能导致内存泄漏的因素以及如何避免这些问题：

内存泄漏问题

可能的内存泄漏原因

未及时关闭空闲连接：

如果启用了 keepAlive，但没有适当的机制来关闭长时间未使用的空闲连接，这些连接将占用内存资源。

不正确的错误处理：

如果在处理请求和响应时没有正确处理错误（如超时、断开连接等），未关闭的连接可能会积累，导致内存泄漏。

高并发连接：

在高并发场景下，如果连接池大小配置不当，可能会导致大量未使用的连接占用内存。

避免内存泄漏的方法

设置合理的空闲超时：

设置 keepAliveTimeout 和 maxSockets 选项，确保空闲连接在合理的时间内关闭，并限制最大并发连接数。

正确处理错误和超时：

实现健壮的错误处理机制，确保在出现错误或超时时关闭连接。

监控和调试：

使用内存分析工具监控应用程序的内存使用情况，及时发现和修复内存泄漏问题。

示例代码

以下是一个配置合理的 HTTP Agent，并启用 keepAlive 的示例代码：

const http = require('http');

// 创建一个 HTTP Agent，启用 keepAlive 并设置合理的超时和最大连接数
const agent = new http.Agent({
  keepAlive: true,
  keepAliveMsecs: 1000,  // 空闲超时时间，单位为毫秒
  maxSockets: 100,       // 最大并发连接数
  maxFreeSockets: 10     // 最大空闲连接数
});

const options = {
  hostname: 'www.example.com',
  port: 80,
  path: '/',
  method: 'GET',
  agent: agent
};

const req = http.request(options, (res) => {
  console.log(`STATUS: ${res.statusCode}`);
  res.setEncoding('utf8');
  res.on('data', (chunk) => {
    console.log(`BODY: ${chunk}`);
  });
  res.on('end', () => {
    console.log('No more data in response.');
  });
});

req.on('error', (e) => {
  console.error(`Problem with request: ${e.message}`);
});

req.end();