OLAP
桂成林
这个作者很懒,什么都没留下…
展开
-
Druid 分析报表中的实战(二)
今天介绍一下druid常用查询类型的TopN和GroupBy。一、数据分类:Timestamp 将时间相近的一些数据聚合在一起,查询的时候指定时间范围,底层使用绝对毫秒数保存的时间戳,默认使用ISO-8601格式展示时间,格式:YYYY-MM-DDTHH:MM:SSSZ,“Z“代表零时区,中国所在的东八区为:“+08:00” Dimensions 与OLAP中的维度是一样的...原创 2020-04-10 15:45:25 · 417 阅读 · 0 评论 -
Druid 分析报表中的实战(一)
产品又过来提需求了!案例需求需要按日汇总充值总数的数据。过滤条件:用户包括:“Tom”和“Jack” 所有城市:“北京”、“上海”、“广州”和“深圳” 日期范围:“2020-03-01”到“2020-03-05”我们用SQL语句表示一下产品需要什么数据,能够直观的理解需求,SQL表达如下:SELECT date,SUM(rechange) AS re...原创 2020-04-07 21:46:59 · 714 阅读 · 0 评论 -
实时OLAP分析利器Druid介绍
Apache Druid 是一个高性能实时分析数据库,在复杂的海量数据下进行交互式实时数据展现的OLAP工具。主要特性:列式存储 预聚合 字典编码 位图索引 流式和批量数据摄入 灵活的数据模式、支持SQL查询 扩展方便,容易运维官方网址:http://druid.io目前国内在使用的公司有:阿里、滴滴、知乎、360、eBay,Hulu等。基础概念...原创 2020-04-05 10:10:28 · 661 阅读 · 0 评论 -
ClickHouse 在广告系统场景中的实践
前言随着数据量的增长,传统DB已经无法满足实时聚合分组排序分析需求,对现在流行的OLAP(实时联机分析)系统进行了调研和实践来满足业务上数据的快速增长,目前比较流行的OLAP系统有:Presto、Druid、Kylin、TiDB+TiFlash和ClickHouse等,本文主要针对ClickHouse进行调研和实验。需求分析业务需求上需要按照广告维度,时间维度等实现快速分组聚合计算排序...原创 2020-03-24 21:30:30 · 863 阅读 · 0 评论 -
ClickHouse 详细集群部署方案
安装依赖:yuminstall-y curl pygpgme yum-utils coreutils epel-releaseYum安装:yum install clickhouse-server clickhouse-client clickhouse-server-common clickhouse-compressor验证是否已经安装:yum list ins...原创 2020-02-12 21:05:27 · 8589 阅读 · 4 评论