![](https://img-blog.csdnimg.cn/20201014180756926.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
大数据处理
ppingfann
这个作者很懒,什么都没留下…
展开
-
Kafka的基本知识梳理
1 背景近期在学习《深入理解Kafka核心设计与实践原理》这本书。接下来希望将每次学习的收获与心得记录成文,也希望可以帮助到同样初入门的人。2 思维导图先分享一下我在学习Kafka的基本知识之后整理的思维导图。3 Kakfa介绍3.1 三大角色Kafka主要用于扮演三种角色,消息系统、存储系统、流式处理平台。3.1.1 消息系统Kafka被用于最多的是消息系统,Kafka和传统的消息系统都具备了系统解耦、冗余存储、流量削峰、缓冲、异步通信、扩展性、可恢复性等功能。同时,Kafka还提供了大原创 2020-09-22 08:42:19 · 352 阅读 · 0 评论 -
Druid安装(单机环境)
背景本篇文章将简单介绍Druid在单机上的安装与安装过程中可能会遇到的问题。主要目的是供初次接触Druid的同学了解Druid所用。准备工作软件Java8(8u92+)Linux或其他类Unix系统硬件4CPU/16GB RAM及以上下载Druid将Apache Druid 0.16.0-incubating下载到机器中。这里我们下载apache-druid-0.16.0...原创 2019-10-27 16:11:32 · 1460 阅读 · 0 评论 -
Apache Druid设计——Segment
Apache Druid在segment文件中存储数据指标,segment文件用时间参数划分分区。在基础设置中,会为每一个时间间隔创建一个segment文件,该时间间隔可以在granularitySpec的segmentGranularity参数中配置。为了让Druid在繁重的查询压力下保持良好的操作性能,应该让segment文件的大小在300mb至700mb之间。如果segment的文件大小超出...翻译 2019-10-26 20:51:19 · 1904 阅读 · 0 评论 -
Apache Druid介绍
什么是Apache Druid?Apache Druid是一个专为大数据集的快速切片分析(OLAP查询)而设计的实时分析数据库。Druid作为数据库,最常用于支持以下用例:实时摄取、快速查询和高运行时长。例如,Druid一般用于支持分析型应用程序的GUI,或是需要快速聚合的高并发API后台。Druid最适合用于面向事件的数据。Druid常见的应用领域包括:点击流分析(Web和移动分析)网...翻译 2019-10-23 11:08:12 · 4399 阅读 · 0 评论