InfluxDB 与 Elasticsearch 的时间序列数据和指标基准

最新推荐文章于 2025-03-03 11:59:42 发布

IccBoY

最新推荐文章于 2025-03-03 11:59:42 发布

阅读量448

点赞数

分类专栏：大数据翻译数据库文章标签： elasticsearch 大数据 influxdb

原文链接：https://www.influxdata.com/blog/influxdb-markedly-elasticsearch-in-time-series-data-metrics-benchmark/

版权

数据库同时被 3 个专栏收录

8 篇文章

订阅专栏

大数据

2 篇文章

订阅专栏

翻译

2 篇文章

订阅专栏

在 InfluxData，开发人员和架构师经常问我们的常见问题之一是：“在时间序列工作负载方面， InfluxDB 与Elasticsearch相比如何？” 提出这个问题可能有几个原因。首先，如果他们正在启动一个全新的项目并进行面对面评估一些解决方案的尽职调查，这可能有助于创建他们的比较网格。其次，他们可能已经在现有监控设置中使用 Elasticsearch 提取日志，但现在想了解如何将指标收集集成到他们的系统中，并相信对于此任务可能有比 Elasticsearch 更好的解决方案。

在过去的几周里，我们开始比较 InfluxDB 和 Elasticsearch 在时间序列工作负载方面的性能和功能，特别关注数据摄取率、磁盘数据压缩和查询性能。InfluxDB 在两项测试中优于 Elasticsearch，与 Elastic 的时间序列优化配置相比，写入吞吐量提高了3.8倍，同时使用的磁盘空间减少了9倍。与 Elasticsearch 的缓存查询的响应时间相比， InfluxDB为测试查询提供的响应时间快了7.7倍。

还需要注意的是，为时间序列配置 Elasticsearch 并非易事 — 它需要预先决定索引、堆大小以及如何使用 JVM。另一方面，InfluxDB 可以开箱即用地用于时间序列工作负载，无需额外配置专为处理时间序列而设计的模式和查询语言。

我们认为这些数据对于评估这两种技术对其用例的适用性的工程师来说是有价值的；具体来说，时间序列用例涉及自定义监控和指标收集、实时分析、物联网 (IoT) 和传感器数据，以及容器或虚拟化基础设施指标。基准测试并未考虑 InfluxDB 对于除基于时间序列的工作负载之外的工作负载的适用性。InfluxDB 并非旨在满足全文搜索或日志管理用例，因此超出了范围。对于这些用例，我们建议坚持使用 Elasticsearch 或类似的全文搜索引擎。

要阅读基准和方法的完整详细信息，请下载“时间序列数据和指标管理的 InfluxDB 与 Elasticsearch 基准测试”技术论文或观看录制的网络研讨会。

我们的首要目标是创建一致的、最新的比较，反映 InfluxDB 和 Elasticsearch 的最新发展以及后来对其他数据库和时间序列解决方案的报道。我们将定期重新运行这些基准测试，并根据我们的发现更新我们的详细技术论文。这些基准测试的所有代码都可以在 Github 上找到。如果您有任何问题、意见或建议，请随时在该存储库上提出问题或拉取请求。

现在，让我们看看结果......

已测试版本

InfluxDB v1.8.0

InfluxDB 是一个用 Go 编写的开源时间序列数据库。其核心是一个称为时间结构合并（TSM）树的定制存储引擎，它针对时间序列数据进行了优化。InfluxDB 由名为InfluxQL的自定义类 SQL 查询语言控制，为跨时间范围的数学和统计函数提供开箱即用的支持，非常适合自定义监控和指标收集、实时分析以及物联网和传感器数据工作负载。

弹性搜索 v7.8.0

Elasticsearch 是一个用 Java 编写并构建在Apache Lucene之上的开源搜索服务器。它提供了适合企业工作负载的分布式全文搜索引擎。虽然 Elasticsearch 本身不是时间序列数据库，但它使用 Lucene 的列索引，用于聚合数值。结合查询时聚合和时间戳字段索引功能（这对于存储和检索日志数据也很重要），Elasticsearch 提供了用于存储和查询时间序列数据的原语。

在构建代表性基准套件时，我们确定了处理时间序列数据时最常评估的特征。我们考察了三个向量的性能：

数据摄取性能– 以每秒的值来衡量
磁盘存储要求– 以字节为单位
平均查询响应时间– 以毫秒为单位

由于 Elasticsearch 是一种特殊用途的搜索服务器，不适用于开箱即用的时间序列数据，因此 Elastic 建议更改一些配置来存储这些类型的指标。在我们的测试中，我们发现这些变化：

对写入或查询性能没有影响
存储要求确实有所不同

关于数据集

对于此基准测试，我们重点关注对常见 DevOps 监控和指标用例进行建模的数据集，其中一组服务器定期报告系统和应用程序指标。我们每 10 秒对 9 个子系统（CPU、内存、磁盘、磁盘 I/O、内核、网络、Redis、PostgreSQL 和 Nginx）采样 100 个值。为了进行关键比较，我们查看了代表 24 小时内 100 台服务器的数据集，这代表了相对适度的部署。