0、概述
使用的都是CLI或者hive –e的方式仅允许使用HiveQL执行查询、更新等操作。然而Hive也提供客户端的实现,通过HiveServer或者HiveServer2,客户端可以在不启动CLI的情况下对Hive中的数据进行操作,两者都允许远程客户端使用多种编程语言如Java、Python向Hive提交请求,取回结果。
HiveServer与HiveServer2的异同?
HiveServer和HiveServer2都是基于Thrift。既然已经存在HiveServer为什么还需要HiveServer2呢?因为HiveServer不能处理多于一个客户端的并发请求,这是由于HiveServer使用的Thrift接口所导致的限制,不能通过修改HiveServer的代码修正。因此在Hive-0.11.0版本中重写了HiveServer代码得到了HiveServer2,进而解决了该问题。HiveServer2支持多客户端的并发和认证,为开放API客户端如JDBC、ODBC提供了更好的支持。
1、启动服务
1)、hive-site.xml的关键配置
hive.metastore.warehouse.dir
/usr/hive/warehouse //(hive中的数据库和表在HDFS中存放的文件夹的位置)
location of default database for the warehouse
hive.server2.thrift.port
10000 //(HiveServer2远程连接的端口,默认为10000)
Port number of HiveServer2 Thrift interface.
Can be overridden by