Go 使用 buger/jsonparser 优化反序列化性能

最新推荐文章于 2023-07-25 08:00:55 发布

码农炎可

最新推荐文章于 2023-07-25 08:00:55 发布

阅读量1.5k

点赞数

文章标签： elasticsearch go json

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u011426433/article/details/106653002

版权

本文介绍了如何通过buger/jsonparser优化Elasticsearch Go SDK的反序列化性能，减少CPU循环消耗，提高数据处理效率。在处理大量数据时，避免了标准库json反序列化的性能瓶颈，通过jsonparser实现流式解析，将CPU使用率从80%降低到20%，并提供了一个从Search/Scroll结果中提取特定字段的例子。

摘要由CSDN通过智能技术生成

前言

最近在做一个工具，从日志系统 ES 集群导出数据，压缩然后上传到腾讯云存储，作为离线冷备份数据。在此过程中，遇到了数个性能问题。

其中 Elasticsearch SDK 的反序列化性能成为了一个瓶颈，因此在这里记录下处理方案。

反序列化性能

olivere/elastic 是一个常用的功能非常强大的 Go Elasticsearch 客户端 SDK，它将大部分 Elasticsearch 的请求参数封装成结构体和方法，易用程度非常高。在处理请求返回值时 olivere/elastic 会使用 Go 内建的 json 库，将请求结果反序列化为对应的结构体，非常便于后续操作。

但是当导出大量数据的时候，比如用 Search/Scroll 每批次上万条文档，进行索引导出时，经 pprof 分析，反序列化会占用大量的 CPU 循环。

因此，为了特定需求，追求极限性能，有必要对此进行特殊处理。

使用 buger/jsonparser

好在 olivere/elastic 提供了 PerformRequest 方法，返回裸字节，我们可以复用现有的工具构建请求，然后自行对返回原始字节进行处理。

这里选用了 buger/jsonparser 库，这个库可以在原始 JSON 字节上进行特定嵌套字段的搜索，和数组遍历。

相较于反序列化为结构体，再对字段进行处理，这种方法可以极大地提升性能并节约内存，确切说，不会消耗任何额外内存。经验证，反序列化所占用的 CPU 循环已经由原先的 80% 减少到 20%。

buger/jsonparser 的使用方法很简单，可以参考官方文档，也可以参考我下面这个例子:

这个例子就是从 Elasticsearch 的 Search/Scroll 结果中，获取 hits.hits 数组的 _source 字段，并调用外部回调，将 _source 字段的原始 JSON 字节传递出去。

// find hits.hits
	var hitsBuf

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

码农炎可 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。