- Google理论背书与百度实践加持:百度Palo数据库宣布开源
- Bloom Filter概念和原理
- Hyperloglog与大数据统计
- 维度表和事实表
- BI中事实表和维度表的定义
- 星型模式、雪花模式和事实星座模式
- Hadoop 过滤,映射,谓词下推基本概念
- BigData – Join中竟然也有谓词下推!?
- 分布式数据库——从线性扩展谈分布式JOIN
- NoSQL bookmarks
MPP 数据仓库系统
- EMC Greenplum
- HP Vertica
- Google Dremel
- Teradata(工商银行在用)
Palo = Google Mesa + Cloudera Impala (分布式查询引擎)
- Druid
- Kylin
- Cloudera Impala
- alluxio
- tachyon-mesos
- gemfire
- Apache Ignite