可能的数据源
Hbase
一个结构化的分布式数据库。存储非关系型数据。
提供数据查询接口有以下几种方式:
- local API(java)
- REST
- Thrift
- C/C++ Apache Hbase Client
- use JDO with HBase
- Scala
- Jython
Phoenix
官方提供了一下的集成:
1.Spark
2.MapReduce
3.Pig
4.EMR
5.Python
6.Flume
7.ORM library for JAVA
而在github上有1个项目avatica(15stars其中一个我)
Spark SQL
SparkSQL是与spark深度集成的,因此没用提供给第三方开发的API是可以理解的。
PS值得注意的是:ThriftServer是一个JDBC/ODBC接口,用户可以通过JDBC/ODBC连接ThriftServer来访问SparkSQL的数据。ThriftServer在启动的时候,会启动了一个SparkSQL的应用程序,而通过JDBC/ODBC连接进来的客户端共同分享这个SparkSQL应用程序的资源,也就是说不同的用户之间可以共享数据;ThriftServer启动时还开启一个侦听器,等待JDBC客户端的连接和提交查询。
DRUID
Python\R\JavaScript\Clojure\Ruby\PHP\SQL
SQL:
1.Apache Calc