Apache Drill已经关注一段时间了,之前一直在孵化器中,现在终于发布了第一个正式版本,其实现主要参考了Google Dremel。
Drill 是Apache开源的一个大数据查询引擎,设计用于支持大数据应用快速查询半结构数据和不规则数据,其提供了ANSI SQL,同时内置了Apache Hive和Apache HBase插件。在大数据处理方面,其提供了一直新的解决方案。目前虽未对其进行性能测试,但是其思想和原理还是非常值得借鉴的,后续有时间将会对其进行深入研究
Drill支持单机和分布式两种模式,单机模式非常简单,完全不需要任何配置,先简单介绍一下单机安装
1、前提
安装的机器已经安装JDK,并且版本为1.7及其以上,同时可以环境变量可以访问。
2、安装
- 下载安装文件:
wget http://getdrill.org/drill/download/apache-drill-1.0.0.tar.gz
-
解压安装:拷贝到想要安装的目录,执行tar -xvzf apache-drill-1.0.0.tar.gz