OLAP
Resemble_
一只程序猿的奇思妙想
github: https://github.com/Resemble
展开
-
Kylin日期函数测试
目录1、需求2、函数调研2.1 Date/time functions2.2 Type conversion3、测试3.1 测试代码3.2 测试结果参考文章1、需求要在Kylin的sql中使用像date_sub类似的功能,date_sub的意义就是2018-08-08的前8天为2018-07-31。2、函数调研2.1 Date/time functi...原创 2018-08-08 15:02:50 · 9149 阅读 · 1 评论 -
时序数据库技术体系 – Druid 多维查询之Bitmap索引
转载自http://hbasefly.com/2018/06/19/timeseries-database-8/时序数据库从抽象语义上来说总体可以概括为两个方面的基本需求,一个方面是存储层面的基本需求:包括LSM写入模型保证写入性能、数据分级存储(最近2小时的数据存储在内存中,最近一天的数据存储在SSD中,一天以后的数据存储在HDD中)保证查询性能以及存储成本、数据按时间分区保证时间线查询...转载 2018-11-06 14:39:55 · 570 阅读 · 0 评论 -
kylin build过程详解
目录1. 计算cuboid文件1.1 生成原始数据(Create Intermediate Flat Hive Table)1.2 创建事实表distinct column文件(Extract Fact Table Distinct Columns)1.3 创建维度词典(Build Dimension Dictionary)1.4 计算生成BaseCuboid文件(Build ...转载 2019-01-25 19:41:43 · 3230 阅读 · 0 评论 -
Presto性能优化
查询速度慢, 如何优化?解决方法1: 避免单节点处理虽然Presto是分布式查询引擎, 但是一些操作是必须在单节点中处理的. 例如: count(distinct x) 考虑使用approx_distinct(x)代替 但是需要注意这个函数有个大约在2.3%的标准误差, 如果需要精确统计的情况, 请绕道. UNION UNION有个功能是: 如果两条记录一...转载 2018-04-13 14:35:19 · 9353 阅读 · 0 评论