自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(148)
  • 收藏
  • 关注

原创 端午安康!ClickHouse 融资 3.5 亿美元,AI 时代的分析神器再进化!

此前 ClickHouse 已累计融资逾 3 亿美元,至此总融资金额突破 6.5 亿美元。

2025-06-03 21:45:00 369

原创 剖析 ClickHouse 如何为 S3 构建分布式缓存

云原生缓存机制无需依赖本地磁盘,也能达到甚至超越 SSD 级的性能表现。

2025-06-03 17:29:23 967

原创 ClickPipes 背后的技术实现:在 ClickHouse 中构建 MySQL 变更数据捕获

ClickPipes 提供了一套健壮且高效的 MySQL CDC 实现方案,能够稳定捕获并实时同步 MySQL 数据库中的变更内容。

2025-05-25 12:33:32 927

原创 ClickHouse 与 Parquet(第一篇) :构建快速 Lakehouse 分析的坚实基础

深入介绍 ClickHouse 如何支持 Lakehouse 更高层的数据表格式和元数据管理机制。

2025-05-19 10:00:00 1001

原创 使用 ClickHouse 可视化 Foursquare 地点数据

ClickHouse 非常适合用于大规模地理空间数据的分析。Foursquare 数据集规模约为 1 亿条记录,而 ADS-B 数据集已超过 1300 亿条,并持续增长中。ClickHouse 甚至支持客户处理规模达数十万亿记录的数据集。在应对此类高负载场景时,ClickHouse 不仅响应迅速,性能也极为稳定可靠。

2025-05-18 16:00:00 725

原创 ClickHouse 25.4 版本发布说明

ClickHouse 25.4 带来了 25 项新功能 🌸 23 项性能优化 🦋 以及 58 个缺陷修复 🐝

2025-05-18 11:40:30 994

原创 ClickHouse 用 AgentHouse 向你展示通过 MCP 集成 LLM 的可能性

AgentHouse 是一个非常值得探索的演示环境,快来尝试一下吧!

2025-05-09 23:00:00 624

原创 据坊间传 ClickHouse 越“懒”越快:惰性物化(Lazy Materialization)正式登场

惰性物化不仅让 ClickHouse 变得更快,也为其 I/O 优化体系画上了关键的一笔。

2025-05-09 22:00:00 561

原创 ClickHouse 联合 Ruby Central 推出 Ruby Gem 下载分析服务

我们与 Ruby Central 合作,在 sql.clickhouse.com 上推出了免费的 Ruby Gem 下载分析服务。

2025-05-09 17:44:59 757

原创 Dash0 如何用 ClickHouse 构建可观测性解决方案

Dash0 选择 ClickHouse 作为其 OpenTelemetry 原生可观测性平台的核心存储引擎,充分体现了架构设计上的专业性与前瞻性。

2025-04-19 15:45:00 959

原创 在用 Rust 的时候,我们会聊什么?ClickHouse 实践一年后的总结

Rust 在 ClickHouse 的应用一切顺利!

2025-04-19 14:45:00 995

原创 内部揭秘 ClickHouse Cloud 极速扩容的机制:Make Before Break

随着架构的全面升级,我们的扩容效率显著提升,系统也不再受到中断与长时扩容等早期问题困扰,资源分配更加快速与稳定。

2025-04-19 10:17:15 627

原创 ClickHouse 查询提速新武器:查询条件缓存

查询条件缓存简单易用,对 ClickHouse 的查询性能提升具有巨大价值。

2025-04-07 10:00:00 755

原创 ClickHouse 25.3 版本发布说明

ClickHouse 25.3 版本正式发布,本次更新带来了18项新功能🌱、13项性能优化🐣、48个bug修复🌦️

2025-04-06 23:45:00 971

原创 解锁 ClickHouse 新技能: JSON 数据性能调优,实时获取业务洞察

通过确保输入表始终小型且不受数据集规模影响,ClickHouse 能够在 任何数据规模下都保持实时 JSON 分析的高性能。

2025-04-06 23:00:00 859

原创 ClickHouse 收购 HyperDX:引领开源可观测性的未来

HyperDX——一个完全基于 ClickHouse 构建的开源可观测性平台

2025-04-06 21:30:00 880

原创 从 Postgres 迁移到 ClickHouse:数据建模技巧更新版 V2

Postgres CDC 让 PostgreSQL 数据高效同步到 ClickHouse,支持大规模数据的实时分析。

2025-04-06 20:30:00 1009

原创 【硬核预警】神秘消失的 CPU:一次 Linux 内核调试之旅

本案例不仅让我掌握了调试技巧,更重要的是让我深入理解了 Linux 内核的底层原理。

2025-03-16 15:12:19 914

原创 ClickHouse 25.2 版本发布说明

ClickHouse 25.2 版本正式发布,本次更新带来了12项全新功能🐣、15项性能优化🥚、72个bug修复🌷

2025-03-15 17:02:15 1007

原创 ClickHouse 输入格式之性能巅峰对决:最快、最高效的选择是什么?

ClickHouse 客户端会根据典型使用场景,自动选择最适合的输入格式,其中针对高吞吐量插入的客户端会优先使用 Native 格式。

2025-03-10 17:00:00 1041

原创 官宣 ClickHouse Connector for Tableau 正式发布

你是否一直想用 Tableau 可视化 ClickHouse 数据?现在,官方 ClickHouse Tableau Connector 已正式发布,助你轻松实现这一目标!

2025-03-10 12:39:26 963

原创 与 ClickHouse 一起攀登冰山(Apache Iceberg)

本文字数:8411;估计阅读时间:22 分钟作者: Melvyn Peignon本文在公众号【ClickHouseInc】首发回顾 2024 年,有一项技术始终引人注目:Apache Iceberg,更广义地说,是湖仓架构。

2025-03-02 19:00:00 810

原创 面向 AI Agent 的数据分析

AI Agent 逐步成为实时分析数据库的活跃用户,这一变化正在重塑我们对数据系统的认知。虽然这一趋势尚处于早期阶段,但随着模型上下文协议 (Model Context Protocol) 的推出,以及 AI 驱动分析工具生态系统的不断扩展,数据系统的基础架构正在逐步演进,以适应这一新需求。AI Agent 正在从单纯的查询执行工具和“函数调用者”,发展为具备数据理解能力、上下文管理能力和洞察力的智能助手。这一趋势既带来了巨大的机遇,也伴随着挑战。

2025-03-02 14:34:13 1128

原创 ClickHouse 开源了 kubenetmon 开源:讲解 ClickHouse Cloud 如何传输监控数据

本文字数:13618;估计阅读时间:35 分钟作者: Ilya Andreev本文在公众号【ClickHouseInc】首发在本文中,我们宣布开源 kubenetmon——这是我们用于监控 ClickHouse Cloud 数据传输的工具。项目地址:GitHub https://github.com/ClickHouse/kubenetmon。云计算为软件团队提供了诸多优势,例如现成的基础设施组件、无限的可扩展性、高性价比等。在云成本规划中,许多企业都会精打细算计算和存储资源的使用。

2025-02-23 11:45:00 792

原创 用 BuzzHouse 填补 ClickHouse 数据库模糊测试的空白

本文字数:5651;估计阅读时间:15 分钟作者: Pedro Ferreira本文在公众号【ClickHouseInc】首发近年来,模糊测试 (Fuzzing) 已成为热门研究方向,广泛用于发现软件缺陷,包括崩溃、错误输出和安全漏洞。数据库同样是研究重点,许多专门针对数据库的模糊测试工具相继问世。ClickHouse 也积极采用模糊测试工具进行测试。

2025-02-23 10:15:00 640

原创 Warehouses:解密 ClickHouse Cloud 的计算资源分离

本文字数:6753;估计阅读时间:17 分钟作者: Dmitry Pavlov本文在公众号【ClickHouseInc】首发在现代云数据库服务中,计算资源分离 (compute-compute separation) 是一种强大的技术,它通过为特定的工作负载、用户或业务功能提供独立的计算资源,优化数据库性能和资源管理。不同于传统的资源共享模式,这种方法可以为不同类型的数据库操作(如读和写)提供专属计算实例,降低操作之间的干扰。

2025-02-22 22:05:42 922

原创 ClickHouse 25.1 版本发布说明

本文字数:12318;估计阅读时间:31 分钟作者: ClickHouse Team本文在公众号【ClickHouseInc】首发又到了每月发布新版本的时间!发布概要ClickHouse 25.1 版本正式发布,本次更新带来了🦃、在本次发布中,我们优化了并行哈希连接算法,引入了二级哈希表进行加速;在表级别新增了 MinMax 索引;改进了 Merge 表;增加了自增功能……还有更多精彩更新等你探索!热烈欢迎 25.1 版本的新贡献者!

2025-02-22 22:00:00 1319

原创 ClickHouse发起十亿JSON文档挑战,性能完胜MongoDB、ES、DuckDB和PostgreSQL等数据库

在我们的基准测试中,ClickHouse 在存储效率和查询性能方面全面超越了所有测试过的 JSON 数据存储系统。在分析型查询方面,ClickHouse 不仅更快——相比领先的 JSON 数据存储(如 MongoDB),它的速度快数千倍,相比 DuckDB 和 PostgreSQL 也是如此,并且比 Elasticsearch 快十倍以上。

2025-02-22 17:31:44 1595

原创 使用 Evidence.dev 可视化 BlueSky 数据

在本篇博客中,我们将深入解析 Evidence.dev 的独特之处,以及它在数据应用构建方面与其他工具的不同之处。按照本文的步骤,你可以高效分析 BlueSky 数据,并构建类似的仪表板来探索你的数据集。目前,我们已将该项目部署到 https://bluesky.evidence.app,你可以在这里查看 BlueSky 数据集的各种可视化结果。通常,浏览器会自动打开 Evidence 应用,如果没有,请手动访问 localhost:3000,即可看到 Evidence 的界面。

2025-02-22 15:20:20 933

原创 ClickHouse 24.12 版本发布说明

本文字数:11871;估计阅读时间:30 分钟作者: ClickHouse官方本文在公众号【ClickHouseInc】首发又到了月度版本更新的时间!发布概要ClickHouse 24.12 版本重磅发布,本次更新带来了🦃、本次版本新增了多项实用功能,包括改进 Enum 的可用性、支持 Iceberg REST 目录和模式演进、实现反序表排序、支持将 JSON 子列作为主键、自动优化 JOIN 的执行顺序等更多亮点功能!我们热烈欢迎 24.12 版本中的所有新贡献者!

2025-02-22 14:07:52 1051

原创 利用高级监控仪表板解决常见数据库问题

通过这篇文章,我们了解了 ClickHouse 的高级仪表板功能,包括如何开始使用它,以及如何利用它识别和解决常见问题。无论您选择哪种部署方式,这款轻量级的监控工具都可以开箱即用。如果您倾向于使用 Prometheus 等第三方监控工具,也可以参考官方文档中的示例进行配置。此外,ClickHouse Cloud 还提供了专属的新仪表板功能,让您可以创建更丰富的可视化效果,值得进一步探索。

2025-02-22 13:53:52 590

原创 ClickHouse 官方文档:处理 JSON 数据 (2/2)

本文字数:15445;估计阅读时间:39分钟作者: ClickHouse team本文在公众号【ClickHouseInc】首发用于导入的几乎所有 JSON 格式都可以用于导出。

2025-02-22 12:27:49 1150

原创 ClickHouse 官方文档:处理 JSON 数据 (1/2)

本文字数:27902;估计阅读时间:70分钟作者: ClickHouse team本文在公众号【ClickHouseInc】首发。

2025-02-21 22:18:16 1015

原创 ClickHouse 查询优化实用指南:第一部分

ClickHouse Playground 中的一个数据集是 NYC Taxi 数据集,其中包含纽约市出租车行程的详细数据。在没有进行任何优化的情况下,我们已经将这个数据集导入。以下是创建表并从 S3 存储桶导入数据的命令。为了方便操作,我们直接从数据中推断表结构。SELECT *接下来,我们先看一下 ClickHouse 自动生成的表结构。识别慢查询。

2024-12-29 22:45:12 1050

原创 使用 ClickHouse 实现 Medallion 架构

本文字数:5739;估计阅读时间:15 分钟作者: PME Team本文在公众号【ClickHouseInc】首发在大规模数据工程中,高效地整理、转换和分析数据集是核心任务。Medallion 架构是一种广泛应用的数据工作流设计模式,利用分层转换方法来组织数据并提高其质量。传统上,人们使用 Spark 和 Delta Lake 等工具来实现这一流程,从原始、杂乱的数据中系统地提取出干净且高质量的数据集,供最终用户分析和使用。

2024-12-29 22:33:49 1215

原创 内部运营干货:手把手教你借助 ClickHouse 搞定产品运营分析

用户群组(cohort)指的是一组在特定时间内共享某些特征或行为的用户。通常,这些群组用于分析用户行为随时间变化的模式。对我们而言,用户群组指的是过去一个月内注册 ClickHouse Cloud 的用户。通过这些群组,我们可以跟踪并比较其参与度、激活率和转化率的趋势,与其他月度群组进行对比。虽然用户群组可以从计费和计量数据中识别,但在产品分析中也能通过简单的查询实现:SELECTuser_id,由于该结果集在分析中被频繁使用,我们将此查询转化为一个物化视图 prod_org_creations。

2024-12-29 22:30:00 1192

原创 ClickHouse 官方文档:如何使用 Grafana 分析数据【5/5】

本文字数:5226;估计阅读时间:14 分钟作者: ClickHouse官方本文在公众号【ClickHouseInc】首发是 ClickHouse 中可观测性数据的首选可视化工具。通过官方的 ClickHouse 插件,用户可以轻松集成。用户可参考这里的安装说明进行安装【https://clickhouse.com/docs/en/integrations/grafana】。

2024-12-29 22:12:17 1047

原创 ClickHouse 24.11 版本发布说明

本次ClickHouse 24.11版本包含了9个新功能🎁、15项性能优化🛷、68个bug修复🐛

2024-12-29 21:51:45 1021

原创 ClickHouse 官方文档:设计可观测性数据模型【2/5】

本文字数:46287;估计阅读时间:116 分钟作者: ClickHouse官方本文在公众号【ClickHouseInc】首发本篇为第二篇《设计数据模型》,正文如下::默认模式使用了基于的设计,这种方式是为特定的访问模式优化的。然而,您的实际访问模式可能与此不完全一致,因此需要根据需求选择主键。:用户可能希望从现有列中提取新字段,例如从列中解析出额外的信息。这可以通过使用物化列来实现,在更复杂的情况下,可以利用物化视图。实现这些功能需要对数据模型进行修改。

2024-12-07 11:00:49 899

原创 ClickHouse 官方文档:使用 ClickHouse 构建可观测性解决方案【1/5】

本文字数:3933;估计阅读时间:10 分钟作者: ClickHouse官方本文在公众号【ClickHouseInc】首发。

2024-12-07 10:31:10 1220

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除