＜JS从入门到放弃＞Nodejs为JS加入Buffer和流

一.Buffer

什么是 buffer？

Buffer 是内存区域。 JavaScript 开发者可能对这个概念并不熟悉，比每天与内存交互的 C、C++ 或 Go 开发者（或使用系统编程语言的任何程序员）要少得多。

它表示在 V8 JavaScript 引擎外部分配的固定大小的内存块（无法调整大小）。

可以将 buffer 视为整数数组，每个整数代表一个数据字节。

它由 Node.js Buffer 类实现。

为什么需要 buffer？

Buffer 被引入用以帮助开发者处理二进制数据，在此生态系统中传统上只处理字符串而不是二进制数据。

Buffer 与流紧密相连。当流处理器接收数据的速度快于其消化的速度时，则会将数据放入 buffer 中。

一个简单的场景是：当观看 YouTube 视频时，红线超过了观看点：即下载数据的速度比查看数据的速度快，且浏览器会对数据进行缓冲。

如何创建 buffer

使用 Buffer.from()、Buffer.alloc() 和 Buffer.allocUnsafe() 方法可以创建 buffer。

const buf = Buffer.from('Hey!')

也可以只初始化 buffer（传入大小）。以下会创建一个 1KB 的 buffer：

const buf = Buffer.alloc(1024)
//或
const buf = Buffer.allocUnsafe(1024)

虽然 alloc 和 allocUnsafe 均分配指定大小的 Buffer（以字节为单位），但是 alloc 创建的 Buffer 会被使用零进行初始化，而 allocUnsafe 创建的 Buffer 不会被初始化。这意味着，尽管 allocUnsafe 比 alloc 要快得多，但是分配的内存片段可能包含可能敏感的旧数据。

当 Buffer 内存被读取时，如果内存中存在较旧的数据，则可以被访问或泄漏。这就是真正使 allocUnsafe 不安全的原因，在使用它时必须格外小心。

使用 buffer

访问 buffer 的内容

Buffer（字节数组）可以像数组一样被访问：

const buf = Buffer.from('Hey!')
console.log(buf[0]) //72
console.log(buf[1]) //101
console.log(buf[2]) //121

这些数字是 Unicode 码，用于标识 buffer 位置中的字符（H => 72、e => 101、y => 121）。

可以使用 toString() 方法打印 buffer 的全部内容：

console.log(buf.toString())

注意，如果使用数字（设置其大小）初始化 buffer，则可以访问到包含随机数据的已预初始化的内存（而不是空的 buffer）！

获取 buffer 的长度

使用 length 属性：

const buf = Buffer.from('Hey!')
console.log(buf.length)

迭代 buffer 的内容

const buf = Buffer.from('Hey!')
for (const item of buf) {
  console.log(item) //72 101 121 33
}

更改 buffer 的内容

可以使用 write() 方法将整个数据字符串写入 buffer：

const buf = Buffer.alloc(4)
buf.write('Hey!')

就像可以使用数组语法访问 buffer 一样，你也可以使用相同的方式设置 buffer 的内容：

const buf = Buffer.from('Hey!')
buf[1] = 111 //o
console.log(buf.toString()) //Hoy!

复制 buffer

使用 copy() 方法可以复制 buffer：

const buf = Buffer.from('Hey!')
let bufcopy = Buffer.alloc(4) //分配 4 个字节。
buf.copy(bufcopy)

默认情况下，会复制整个 buffer。另外的 3 个参数可以定义开始位置、结束位置、以及新的 buffer 长度：

const buf = Buffer.from('Hey!')
let bufcopy = Buffer.alloc(2) //分配 2 个字节。
buf.copy(bufcopy, 0, 0, 2)
bufcopy.toString() //'He'

切片 buffer

如果要创建 buffer 的局部视图，则可以创建切片。切片不是副本：原始 buffer 仍然是真正的来源。如果那改变了，则切片也会改变。

使用 slice() 方法创建它。第一个参数是起始位置，可以指定第二个参数作为结束位置：

const buf = Buffer.from('Hey!')
buf.slice(0).toString() //Hey!
const slice = buf.slice(0, 2)
console.log(slice.toString()) //He
buf[1] = 111 //o
console.log(slice.toString()) //Ho

二.流

什么是流

流是为 Node.js 应用程序提供动力的基本概念之一。

它们是一种以高效的方式处理读/写文件、网络通信、或任何类型的端到端的信息交换。

流不是 Node.js 特有的概念。它们是几十年前在 Unix 操作系统中引入的，程序可以通过管道运算符（|）对流进行相互交互。

例如，在传统的方式中，当告诉程序读取文件时，这会将文件从头到尾读入内存，然后进行处理。

使用流，则可以逐个片段地读取并处理（而无需全部保存在内存中）。

Node.js 的 stream 模块提供了构建所有流 API 的基础。所有的流都是 EventEmitter 的实例。

为什么是流

相对于使用其他的数据处理方法，流基本上提供了两个主要优点：

内存效率: 无需加载大量的数据到内存中即可进行处理。
时间效率: 当获得数据之后即可立即开始处理数据，这样所需的时间更少，而不必等到整个数据有效负载可用才开始。

流的示例

一个典型的例子是从磁盘读取文件。

使用 Node.js 的 fs 模块，可以读取文件，并在与 HTTP 服务器建立新连接时通过 HTTP 提供文件：

const http = require('http')
const fs = require('fs')

const server = http.createServer(function(req, res) {
  fs.readFile(__dirname + '/data.txt', (err, data) => {
    res.end(data)
  })
})
server.listen(3000)

readFile() 读取文件的全部内容，并在完成时调用回调函数。

回调中的 res.end(data) 会返回文件的内容给 HTTP 客户端。

如果文件很大，则该操作会花费较多的时间。以下是使用流编写的相同内容：

const http = require('http')
const fs = require('fs')

const server = http.createServer((req, res) => {
  const stream = fs.createReadStream(__dirname + '/data.txt')
  stream.pipe(res)
})
server.listen(3000)

当要发送的数据块已获得时就立即开始将其流式传输到 HTTP 客户端，而不是等待直到文件被完全读取。

pipe()

上面的示例使用了 stream.pipe(res) 这行代码：在文件流上调用 pipe() 方法。

该代码的作用是什么？它获取来源流，并将其通过管道传输到目标流。

在来源流上调用它，在该示例中，文件流通过管道传输到 HTTP 响应。

pipe() 方法的返回值是目标流，这是非常方便的事情，它使得可以链接多个 pipe() 调用，如下所示：

src.pipe(dest1).pipe(dest2)

此构造相对于：

src.pipe(dest1)
dest1.pipe(dest2)

流驱动的 Node.js API

由于它们的优点，许多 Node.js 核心模块提供了原生的流处理功能，最值得注意的有：

process.stdin 返回连接到 stdin 的流。
process.stdout 返回连接到 stdout 的流。
process.stderr 返回连接到 stderr 的流。
fs.createReadStream() 创建文件的可读流。
fs.createWriteStream() 创建到文件的可写流。
net.connect() 启动基于流的连接。
http.request() 返回 http.ClientRequest 类的实例，该实例是可写流。
zlib.createGzip() 使用 gzip（压缩算法）将数据压缩到流中。
zlib.createGunzip() 解压缩 gzip 流。
zlib.createDeflate() 使用 deflate（压缩算法）将数据压缩到流中。
zlib.createInflate() 解压缩 deflate 流。

不同类型的流

流分为四类：

Readable: 可以通过管道读取、但不能通过管道写入的流（可以接收数据，但不能向其发送数据）。当推送数据到可读流中时，会对其进行缓冲，直到使用者开始读取数据为止。
Writable: 可以通过管道写入、但不能通过管道读取的流（可以发送数据，但不能从中接收数据）。
Duplex: 可以通过管道写入和读取的流，基本上相对于是可读流和可写流的组合。
Transform: 类似于双工流、但其输出是其输入的转换的转换流。

如何创建可读流

从 stream 模块获取可读流，对其进行初始化并实现 readable._read() 方法。

首先创建流对象：

const Stream = require('stream')
const readableStream = new Stream.Readable()

然后实现 _read：

readableStream._read = () => {}

也可以使用 read 选项实现 _read：

const readableStream = new Stream.Readable({
  read() {}
})

现在，流已初始化，可以向其发送数据了：

readableStream.push('hi!')
readableStream.push('ho!')

如何创建可写流

若要创建可写流，需要继承基本的 Writable 对象，并实现其 _write() 方法。

首先创建流对象：

const Stream = require('stream')
const writableStream = new Stream.Writable()

然后实现 _write：

writableStream._write = (chunk, encoding, next) => {
  console.log(chunk.toString())
  next()
}

现在，可以通过以下方式传输可读流：

process.stdin.pipe(writableStream)

如何从可读流中获取数据

如何从可读流中读取数据？使用可写流：

const Stream = require('stream')

const readableStream = new Stream.Readable({
  read() {}
})
const writableStream = new Stream.Writable()

writableStream._write = (chunk, encoding, next) => {
  console.log(chunk.toString())
  next()
}

readableStream.pipe(writableStream)

readableStream.push('hi!')
readableStream.push('ho!')

也可以使用 readable 事件直接地消费可读流：

readableStream.on('readable', () => {
  console.log(readableStream.read())
})

如何发送数据到可写流

使用流的 write() 方法：

writableStream.write('hey!\n')

使用信号通知已结束写入的可写流

使用 end() 方法：

const Stream = require('stream')

const readableStream = new Stream.Readable({
  read() {}
})
const writableStream = new Stream.Writable()

writableStream._write = (chunk, encoding, next) => {
  console.log(chunk.toString())
  next()
}

readableStream.pipe(writableStream)

readableStream.push('hi!')
readableStream.push('ho!')

writableStream.end()