滴滴基于 Clickhouse 构建新一代日志存储系统

滴滴技术

于 2024-03-05 20:00:27 发布

阅读量3.8k

点赞数 10

文章标签： clickhouse

本文链接：https://blog.csdn.net/didi_tech/article/details/136493849

版权

本文介绍了滴滴如何从ES迁移到ClickHouse进行日志检索，解决ES性能瓶颈和存储成本问题。通过ClickHouse的分布式架构、高效写入和查询性能，以及针对大规模数据和复杂查询场景的优化设计，实现存储成本降低、查询速度提升和系统稳定性增强。

摘要由CSDN通过智能技术生成

ClickHouse 是2016年开源的用于实时数据分析的一款高性能列式分布式数据库，支持向量化计算引擎、多核并行计算、高压缩比等功能，在分析型数据库中单表查询速度是最快的。2020年开始在滴滴内部大规模地推广和应用，服务网约车和日志检索等核心平台和业务。本文主要介绍滴滴日志检索场景从 ES 迁移到 CK 的技术探索。

背景

此前，滴滴日志主要存储于 ES 中。然而，ES 的分词、倒排和正排等功能导致其写入吞吐量存在明显瓶颈。此外，ES 需要存储原始文本、倒排索引和正排索引，这增加了存储成本，并对内存有较高要求。随着滴滴数据量的不断增长，ES 的性能已无法满足当前需求。

在追求降低成本和提高效率的背景下，我们开始寻求新的存储解决方案。经过研究，我们决定采用 CK 作为滴滴内部日志的存储支持。据了解，京东、携程、B站等多家公司在业界的实践中也在尝试用 CK 构建日志存储系统。

挑战

面临的挑战主要来自下面三个方面：