Druid是个用于海量查询、聚合的工具,项目比较新,资料方面还比较少。这里是一位博主fish_cool总结的资料,包括Druid的简介,适用的场景,用法等,很大部分也是从Druid官网上总结的,写得很不错。这篇文章要介绍的是实验室自己的系统设计思路。
整个系统的架构是 flume -> kafka -> druid,flume 与kafka的整合之前在搭建flume -> kafka -> storm的时候有详细文档,通过 flume实现为kafka 的producer api,将程序打包成 jar放置在flume/lib 下,配置agent文件即可。
一、部署
部署druid需要先部署它的一些依赖,最主要的是两个: zookeeper和mysql ,zookeeper是 druid集群非常重要的一环,用于管理各个不同节点之间的工作和协调系统的运行。 mysql则是用来存储rules, segment等等的元数据。
zookeeper