怎么调用新建模型里文章的内容_从时空维度看 I/O 模型（更新）

最新推荐文章于 2024-08-12 10:00:42 发布

weixin_39981093

最新推荐文章于 2024-08-12 10:00:42 发布

阅读量44

点赞数

文章标签：怎么调用新建模型里文章的内容

微信限制：不能放置链接，代码样式比较奇怪，发布后不能更新。。。

同步、阻塞

例如，调用 UNIX 系统的 send() 通过普通的 fd 发送数据：

ssize_t ret = send(fd, buffer, len, flags);

当前线程的函数调用阻塞到 I/O 完成时

同步、非阻塞

例如，调用 UNIX 系统的 send() 通过非阻塞的 fd 发送数据：

evutil_make_socket_nonblocking(fd);

while (len) {
ssize_t ret = send(fd, buffer, len, flags);
// case1: ready to send
if (ret >= 0) {
    len -= ret;
continue;
  }
// case2: not ready
if (EVUTIL_SOCKET_ERROR() == EAGAIN)
continue;
// case3: socket error
}

可以使用 libevent 提供的 evutil_make_socket_nonblocking() 将 fd 设置为非阻塞
函数调用立即返回：
- 如果可以发送数据，则立即发送数据
- 如果暂时无法发送数据，EVUTIL_SOCKET_ERROR() 返回 EAGAIN / EWOULDBLOCK
- 否则，socket 错误(比如断开、异常)

异步、非阻塞

例如，Node.js 通过 fs.readFile() 读取文件：

fs.readFile(filename, (err, data) => {
if (err) {
// handle |err|
  }
// use |data|
});
console.log('start file I/O, and continue');

需要系统/语言支持，一般提供基于回调 (callback) 的接口：
- 函数 fs.readFile() 发起 I/O 请求，然后立即返回
- 在 “发起 I/O 请求” 到 “I/O 完成” 之间，当前线程会往下执行 console.log() 的代码
- I/O 完成时，通过回调 (err, data) => { ... } 传入数据 data(如果成功)或错误 err(如果失败)
如果系统/语言不支持，则可以在用户态通过 I/O 多路复用 (I/O multiplexing) 模拟 “异步”：
- 例如 libevent 封装了 epoll() 的轮询操作，提供了基于回调的接口
- 但本质上还是同步的(主线程同步处理所有 I/O 并调用回调)
回调的线程/调用栈在不同环境下不一样：
- Unix 的 aio_read() 和 Windows 的 ReadFileEx() 由系统回调，具体线程/调用栈不确定
- Node.js 的 fs.readFile() 由 JavaScript 环境在主线程回调
- 用户态的 I/O 多路复用在分派的线程回调(例如 libevent event_base_dispatch() 调用回调)
本质上 —— 通过 CPS (continuation-passing style) 将 “I/O 结果的处理逻辑” 作为 continuation 传递：
- 如果需要进行连续多次 I/O 操作，回调函数嵌套会导致回调地狱 (callback hell) 问题
- 但可以通过链式传递 continuation 化简(参考：Chained Promises (JavaScript))

异步、阻塞

例如，Node.js 用 util.promisify 封装 fs.readFile() 接口：

const readFileAsync = util.promisify(fs.readFile);

try {
const data = await readFileAsync(filename);
// use |data|
} catch (err) {
// handle |err|
}

需要系统/语言支持，一般采用基于协程 (coroutine) async/await 的接口：
- 函数 readFileAsync 发起 I/O 请求，然后阻塞到 I/O 完成时
- 在 “发起 I/O 请求” 到 “I/O 完成” 之间，当前线程会切换执行其他代码
- I/O 完成时，当前线程切换回去，并返回数据 data(如果成功)或抛出异常 err(如果失败)
如果系统/语言不支持，则无法实现：
- 例如 UNIX 系统/C 语言不支持协程(参考：Asynchronous I/O Forms)
本质上 —— 属于非抢占式/协作式多任务 (nonpreemptive/cooperative multitasking) 模型；协程调度(异步、阻塞)相对于线程调度(同步、阻塞)的优势在于：
- 更简单 —— 没有多线程的数据竞争问题，不需要考虑线程同步问题
- 开销小 —— 无需系统调用，自己管理调用栈内存，没有数量限制
- 更高效 —— 有更多机会被执行(不管怎么切换，执行的代码都在当前线程)

世界观

阻塞/非阻塞像是空间维度的对比 —— “发起 I/O 请求” 是否通过函数返回值传递 “I/O 结果”：

	阻塞模型	非阻塞模型
发起 I/O 请求调用	I/O 完成时返回	立即返回
如何传递 I/O 结果	函数返回值	轮询结果或回调传参
在哪处理 I/O 逻辑	函数调用后	轮询完成后或回调函数
代码(空间)连续性	连续	非连续
代码可读性	逻辑连贯	逻辑分散

同步/异步像是时间维度的对比 —— 从 “发起 I/O 请求” 到 “I/O 完成” 之间，同一线程会不会执行其他代码：

	同步模型	异步模型
发起 I/O 请求后	等待 I/O 结果	往下执行或挂起协程
在等待 I/O 期间	只等待 I/O 完成	执行其他代码
当 I/O 完成后	结束阻塞或完成轮询	调用回调或恢复协程
执行(时间)连续性	连续	非连续
代码执行效率	线程利用率低	线程利用率高

对于同步、阻塞模型，常用多进程/多线程提高 I/O 吞吐量(多个进程/线程同时发起 I/O，分别等待各自 I/O 结果)
对于同步、非阻塞模型，常用 I/O 多路复用提高 I/O 吞吐量(一个线程同时发起多个 I/O，同时轮询所有 I/O 结果)
对于异步模型，由于回调/协程调度顺序不确定，需要在 I/O 完成后检查上下文 (context) 的有效性(参考：深入 C++ 回调)
对于 reactor 模式(I/O 多路复用，不同于 proactor 模式)、future-promise 模型，可以认为是非阻塞(同时发起多个 I/O 请求)+ 阻塞(等待 I/O 完成) 的同步模型

写在最后

随着编程语言的发展，I/O 模型不断优化：

效率优化 —— 从同步到异步
可读性优化 —— 从阻塞到非阻塞再回到阻塞

最后聊个臆想：

为什么阻塞到非阻塞容易理解？
而对于同步到异步却难以理解？

因为 “低维度的生物无法理解高维度的世界”：

如果阻塞 I/O 的代码类似于一维空间里的生物，那么非阻塞 I/O 的代码类似于生活在二维空间里：
- 给顺序执行增加一个空间维度，就可以实现非顺序执行
如果同步 I/O 的代码运行在我们的三维空间里，那么异步 I/O 的代码需要时间维度的支持，至少在四维空间里才能实现：
- 三维空间感知到的时间总是线性的，永远不会静止
- 而在四维空间里，可以挂起一个三维空间，切换到另一个三维空间
- 在被挂起的三维空间里，时间静止在了某一刻
- 而四维空间里的时间却还在流动

感谢 @flythief / @WalkerJG 的 review~

如果有什么问题，欢迎交流。?

左下角 阅读原文 ?

右上角 关注公众号 ❤ / 分享文章 ?

右下角 留言评论~ ? / 觉得好看 ?