druid
文章平均质量分 89
Alvin家鸡鸭鱼的小米米
努力成为一位有灵魂、有信仰、有自己生活的软件工程师
展开
-
Druid大数据实时处理的开源分布式系统——介绍
AbstractDruid 是一个为在大数据集之上做实时统计分析而设计的开源数据存储。这个系统集合了一个面向列存储的层,一个分布式、shared-nothing的架构,和一个高级的索引结构,来达成在秒级以内对十亿行级别的表进行任意的探索分析。以下将详细阐述Druid的架构,如何支持快速聚合、灵活的过滤、和低延迟数据导入。1. 介绍Druid是一个用于大数据实时查询和分析的高容错、高性能原创 2017-10-22 13:13:20 · 5495 阅读 · 0 评论 -
Druid大数据实时处理的开源分布式系统——Historical Node
最近开始整理有关Druid的技术知识。以下是第二篇关于Historical Node。Historical 主要完成如下功能:1. Loading and ServingSegments2. Loading and ServingSegments From CacheHistorical Node的职责单一,就是负责加载Druid中非实时窗口内且满足加载规则的所原创 2017-10-23 11:25:10 · 1294 阅读 · 0 评论 -
Druid大数据实时处理的开源分布式系统——Broker
第三篇,关于Druid的Broker节点Broker节点接收来自外部客户端的查询,并将这些查询转发到Realtime和Historical节点。当Broker节点收到结果,它们将合并这些结果并将它们返回给调用者。由于了解拓扑,Broker节点使用Zookeeper来确定哪些Realtime和Historical节点的存在。Broker 主要完成如下功能:1. Forward原创 2017-10-23 11:38:12 · 2171 阅读 · 0 评论 -
Druid大数据实时处理的开源分布式系统——Coordinator
Druid技术笔记整理第4篇,关于Druid CoordinatorCoordinator 主要完成如下功能:1. loading new segments2. dropping outdated segments3. managing segment replication4. balancing segment loadCoordin原创 2017-10-23 11:45:05 · 1509 阅读 · 2 评论