大数据
文章平均质量分 97
小黑妹
穷则独善其身,达则兼济天下!
展开
-
大数据概述1
大数据概述第1部分大数据概念:1. Volume 大量化2. VELOCITY 快速化3. VARIETY 多样化4. VALUE 价值化 数据量大大数据摩尔定律:根据IDC估测,数据一直都在以每年50%的速度增长,也就是说每两年就增加一倍。人类在最近两年产生的数据量相当于之前产生的全部数据量。预计到2020年全球总共原创 2017-01-11 16:50:49 · 2007 阅读 · 2 评论 -
Druid.io实时大数据原理介绍
Druid.io是“神马”?Druid.io是一个开源的,分布式的,列式存储的,适用于实时数据分析的OLAP系统。它能够快速聚合、灵活过滤、毫秒级查询、和低延迟数据导入。2011年,MetaMarkets公司为了解决广告交易中海量实时数据的分析问题,在尝试各种SQL和NoSQL方案后,决定自行设计并创建Druid并于2013年开源。Druid被设计成支持PB级别数据量每天处理数十亿流式事件。Dru...原创 2018-04-01 22:19:50 · 4778 阅读 · 3 评论 -
Druid大数据之存储和查询
Druid数据格式时间列(Timesatmp):表明每行数据的时间值,默认使用UTC时间格式并且精确到毫秒级别。这个列是数据聚合与范围查询的重要维度。维度列(Dimension):维度来自于OLAP的概念,用来标识数据行的各个类别信息。指标列(Metrics):指标对应于OLAP概念中的Fact,是用于计算和聚合的列。指标列通常是一些数字,计算操作通常包括Count,Sum,Mean等。从上表可知...原创 2018-04-01 22:23:17 · 12097 阅读 · 2 评论 -
kafka indexing service
task 创建和运行的过程:task停止的过程原创 2018-04-03 20:48:56 · 568 阅读 · 0 评论