1.1 kudu使用方法
(1)可通过Java client、C++ client、Python client操作kudu表,但要构建client并编写应用程序;
(2)可通过kudu-spark包集成kudu与spark,并编写spark应用程序来操作kudu表;
(3)可通过impala的shell对kudu表进行交互式的操作,因为impala2.8及以上的版本已经集成了对kudu的操作。下面主要讲述基于impala的使用方法。
1.2 基本要求
安装2.8及以上版本的impala,并安装hive,使用其metastore服务来存储impala的元数据。此处Hadoop、hive、impala的安装过程省略。
1.3 impala和kudu的相关配置
因为impala已经集成对kudu的操作,因此impala与kudu不需要做任何参数的配置,但为了方便,在impala的配置文件/etc/default/impala中给字段IMPALA_SERVER_ARGS增加参数-kudu_master_hosts= slave217:7051,如图: