这是目前唯一一本介绍HAWQ技术的中文书。涵盖HAWQ技术解析、其上的数仓架构及实现、简单数据挖掘三部分,内容较为全面,每部分均有详细配置说明及示例代码。用不打折扣的SQL教据库玩转大数据,无论是学习、开发,还是部署、运行,HAWQ是你的效率之选!
我体验的HAWQ五大特点:
- 依赖少:只需要HDFS一种Hadoop基础服务作为底层存储(相比Kylin)。
- 性能高:比Hive快一个数量级以上,而且不需要预先建立cube(相比其它)。
- 兼容全:全面兼容SQL标准,涵盖所有常用窗口、分析、聚合函数(相比Impala)。
- 可编程:能在Hadoop上编写SQL UDF(相比其它)。
- 易挖掘:原生支持MADlib,仅用SQL查询就能进行简单的数据挖掘与机器学习(相比其它)。
- 实现行级更新(update/delete)、索引、with recursive、pivot等基本功能;
- 增强外部表的支持(如外部分区表等),提高外部表性能;
- 提高除HDP外其它Hadoop发行版本的支持与普适度;
- 增强机器学习库(MADlib)。