什么流读取MultipartFile_深入理解并运用Node中的IO模型流

最新推荐文章于 2024-06-29 02:51:39 发布

weixin_39922147

最新推荐文章于 2024-06-29 02:51:39 发布

阅读量132

点赞数

文章标签：什么流读取MultipartFile

在 NodeJs 中，流随处可见，读/写文件流，HTTP请求/返回流，stdin/stdout流。理解并运用好流会让你的Node更具力量。

Stream

lib/_stream_readable.js
lib/_stream_writable.js
lib/_stream_tranform.js
lib/_stream_duplex.js

流主要有可读 Readable，可写流 Writable，双工可读可写流 Duplex， Transform 流就是继承 Duplex 的。
通过pipe管道，可读流可以pipe到一个或多个可写流。
看源码能发现里面涉及了一堆状态控制的代码，什么时候读，什么时候写，什么时候暂停读。
大部分情况下程序面对的问题。通常都可以抽象成一个输入/输出的问题，中间可能会包含转换。

实际问题怎么运用流呢。

读取大文件

小文件可以一次性读到内存，但如果一个 10G 的文件呢？ReadLine 模块很好用但是你知道背后怎么实现的吗。
试试怎么用 stream.Transform 来自己实现一个readLine

const

通过实现一个消费/可写流我们就可以来对大文件进行处理，比如说实现一个 word count 计数器，从文件导入到数据库。

而不用担心需要一次性读取整个文件到内存里out of memory这种问题。

通过继承 strean 模块我们也不需要过多的去考虑什么时候该读，什么时候因为写的压力大（背压），该停止读，让整个读写流有序的运行。
你只需要专注于实现你自己的 write read transform
Spark, Strom 的实时计算流也是这样的，大任务分解成小任务，只需要专注于自己业务逻辑的 map，reduce

单机爬虫

再举个栗子, 它的输入可能是一堆 URL、输出是结构化的数据。需要写入到关系型数据库。

可以把 URL 数据获取抽象成一个可读流，
爬取过程，数据提取抽象成一个 transform 流
写入数据库抽象成一个可写流，

只需要约定好每个过程输出的数据模型，就可以在每个过程实现各种目的不一样的流。

如数据源，可以是读取文件，MYQL，分布式列队
抓取转换流，可以是普通的 HTTP爬虫，Puppeteer 可渲染性爬虫
数据存储流，可以写文件，MYQL，或者HDFS

read > transform > write

这样程序看起来是不是特别简洁？

URL 读取流

const

把 URL 的变成结构化数据的转换流

const

mysql 入库写入流

// mysql表模型

是不是简洁明了？
在Node中异步流随处可见，谁让它基因就是这样呢。

参考：

https://nodejs.org/api/stream.html
https://www.barretlee.com/blog/2017/06/06/dive-to-nodejs-at-stream-module/
https://nodejs.org/en/docs/guides/backpressuring-in-streams/

weixin_39922147

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。